Tại sao tôi đã hủy đăng ký Claude: Vấn đề Token, chất lượng giảm sút và hỗ trợ kém

Ban đầu rất ấn tượng với Claude Code, tác giả đã quyết định hủy đăng ký do hàng loạt vấn đề: việc tính toán token bất hợp lý, chất lượng phản hồi giảm sút với các giải pháp "lười", và dịch vụ hỗ trợ khách hàng thiếu chuyên nghiệp.

Vài tuần trước, tôi đã đăng ký gói Claude Code và trong những tuần đầu tiên, trải nghiệm thực sự rất tuyệt vời. Nó nhanh chóng, hạn mức token công bằng và chất lượng phản hồi rất tốt. Tôi biết rằng họ đã tăng hạn mức token cho các khung giờ thấp điểm, và vì họ đã phản đối một số quy định của chính phủ, việc ủng hộ một mục đích đúng đắn khiến tôi cảm thấy khá hài lòng.

Tuy nhiên, trong khoảng ba tuần qua, sự hào hứng ban đầu của tôi đã giảm sút nhanh chóng.

Hỗ trợ khách hàng kém cỏi

Vấn đề bắt đầu cách đây ba tuần. Tôi bắt đầu làm việc vào buổi sáng sau khoảng mười giờ nghỉ ngơi; đủ thời gian để token của tôi được làm mới. Tôi đã gửi hai câu hỏi nhỏ đến Claude Haiku. Đó là những câu hỏi đơn giản, thậm chí không liên quan đến kho lưu trữ (repository).

Đột nhiên, việc sử dụng token tăng vọt lên 100%.

Tôi đã liên hệ với "bot hỗ trợ AI" của họ, bot này đã trả lại một số thông tin hỗ trợ mặc định vô nghĩa và không thực sự hiểu vấn đề. Vì vậy, tôi đã yêu cầu hỗ trợ từ con người. Vài ngày sau, một nhân viên hỗ trợ (dựa trên ngữ cảnh có vẻ là người thật) đã gửi phản hồi. Nó bắt đầu như thế này:

"Hệ thống của chúng tôi phát hiện yêu cầu của bạn liên quan đến giới hạn sử dụng trên gói Pro hoặc Max của bạn."

Vâng, đúng là gói Pro. Có vẻ như hệ thống của họ thực sự không được truy vấn; đó chỉ là lời mở đầu mặc định và có lẽ là câu trả lời mặc định, bởi vì:

Điều này được theo sau bởi một câu trả lời dài dòng dường như được sao chép và dán từ tài liệu của họ, giải thích cách giới hạn hàng ngày và hàng tuần hoạt động.

Và nó kết thúc bằng dòng gây thất vọng điển hình mà không khách hàng nào muốn đọc ở cuối một email và là cái "ngón tay giữa" kinh điển của bộ phận hỗ trợ — chúng tôi không quan tâm vấn đề của bạn có được giải quyết hay không, chúng tôi tuyên bố nó đã đóng.

"Lưu ý rằng các phản hồi tiếp theo cho vé này có thể không được theo dõi. Nếu yêu cầu của bạn không liên quan đến giới hạn sử dụng trên gói Pro hoặc Max của bạn, hoặc bạn cần hỗ trợ thêm, vui lòng truy cập trang trợ giúp của chúng tôi tại..."

Tuyệt vời! Gửi một email tự động không đề cập đến vấn đề thực tế và sau đó đóng kênh liên lạc. Cảm ơn vì chẳng có gì, tôi đoán vậy?

Chất lượng đi xuống

Trong những ngày và tuần tiếp theo, chất lượng còn xa mới đáp ứng nhu cầu của tôi hoặc phù hợp với trải nghiệm ban đầu. Trong khi tôi từng có thể làm việc đồng thời lên đến ba dự án, bây giờ giới hạn token lại bị cạn kiệt sau hai giờ làm việc trên một dự án duy nhất.

Và chất lượng đang suy giảm. Tôi hoàn toàn nhận thức được điều này khá chủ quan và chất lượng của tác nhân AI luôn chịu ảnh hưởng nặng nề bởi người vận hành. Thất bại thường xuất hiện ngay trước màn hình. Nhưng này, tôi cũng phát triển bằng Github Copilot, Codex của OpenAI và tôi đang chạy suy luận (inference) của riêng mình với OMLX và Continue sử dụng Qwen3.5-9B. Tôi không phải là chuyên gia, tôi đôi khi lười biếng nhưng tôi có lẽ cũng biết một chút này chút kia.

Hãy để tôi đưa ra ví dụ tuyệt vời này: hôm qua tôi yêu cầu Claude Opus refactor một dự án.

Trong khi tôi đang duyệt nhật ký suy nghĩ (thinking log) của mô hình — điều mà tôi rất khuyên bạn nên làm không chỉ thỉnh thoảng — tôi đã tìm thấy điều này:

"Thay vì chỉnh sửa từng thanh trượt trong JSX, tôi sẽ thêm một bộ khởi tạo chung trong ui-events.js tự động chèn hiển thị giá trị cho tất cả các đầu vào phạm vi (range inputs) thiếu nó."

Đây rõ ràng là một thực hành tồi. Đó là một giải pháp thay thế tạm thời (workaround) rẻ tiền mà bạn thậm chí không mong đợi từ một lập trình viên junior; nó đọc giống như một người chỉ đơn giản là không muốn mang lại kết quả tốt. Phản hồi của tôi:

"bạn không thể nghiêm túc được đấy — đây là cách bạn sửa mọi thứ sao? chỉ là WORKAROUNDS????"

Ít nhất Opus đã thừa nhận:

"Bạn đúng rồi, điều đó lười biếng. Để tôi làm cho đúng — thêm các nhãn trực tiếp trong JSX và kết nối chúng một cách rõ ràng."

Nhà phát triển lười biếng — ít nhất thì cũng trung thực.

Không cần phải nói, phím tắt này đã tốn của tôi khoảng 50% hạn mức token năm giờ của tôi.

Cảnh báo giới hạn token

Vấn đề về Cache và giới hạn khó hiểu

Bây giờ chủ đề bộ nhớ đệm (cache) lại xuất hiện — cùng với những thứ khác. Ít nhất họ đang nói chuyện cởi mở về nó. Vấn đề là: khi bạn quay lại làm việc sau một thời gian, bộ nhớ cache hội thoại của bạn biến mất và mô hình bắt đầu đọc lại cơ sở mã của bạn. Về mặt chi phí, điều này rất thông minh. Nhưng về mặt trải nghiệm? Điều đó có nghĩa là bạn đã trả token cho lần tải ban đầu và sau một khoảng nghỉ buộc vì cửa sổ token năm giờ đã chạm giới hạn, bạn lại trả tiền cho cùng một lần tải đó.

Nghĩ đó là tất cả? Chờ đã, tôi còn có câu chuyện vui này: đột nhiên cửa sổ hàng tuần thay đổi từ hôm nay sang thứ Hai. OK, tôi biết ơn vì nó đi kèm với việc đặt lại về số không. Nhưng vẫn là: chuyện gì đang xảy ra vậy, Anthropic? Không chỉ vậy — trong khi tôi đang làm việc trên dự án của mình, theo dõi việc sử dụng token với sự cảnh giác của Argus, một cảnh báo nhỏ này hiện lên:

Cảnh báo giới hạn hàng tháng

Chờ đã, cái gì? Tôi không phải là một phần của tổ chức nào cũng không thấy bất kỳ gợi ý nào về việc tại sao đột nhiên tôi phải lo lắng về "giới hạn sử dụng hàng tháng" — cũng như giới hạn hàng giờ và hàng tuần vẫn chưa bị vượt quá. Đang có chuyện gì vậy?

Hóa ra là — hai giờ sau — nó cho phép tôi tiếp tục làm việc. Cảnh báo đã biến mất.

Ít nhất tài liệu này không đề cập đến giới hạn sử dụng hàng tháng. Và trang cài đặt chỉ liệt kê các giới hạn cho phiên hiện tại và tuần.

Vậy... giới hạn hàng tháng này là sao, Anthropic?

Lời kết: Xin lỗi vì đã làm Anthropic thất vọng

Tôi là một người hâm mộ lớn của sản phẩm này. Về mặt lý thuyết, mọi thứ hoạt động như một lời nguyền; nó cung cấp rất nhiều cơ hội. Tôi đã xây dựng hệ thống điều khiển của riêng mình xung quanh Claude, tôi ngưỡng mộ Claude Code làm việc trong nền trên một loạt vấn đề GitHub, tôi thích sử dụng Claude Cowork để tiếp tục viết Nerd Enzyklopädie của mình. Nhiều tính năng thực sự chu đáo.

Tôi đã tăng năng suất của mình lên một cấp độ lớn, và thực sự thú vị khi thấy hàng nghìn ý tưởng đang bò trong đầu tôi giờ đây chỉ cách một cái chớp mắt — dễ dàng và nhanh chóng hơn để hiện thực hóa so với bốn năm trước.

Và tôi hiểu những thách thức về kỹ thuật và tổ chức khi cung cấp một sản phẩm như vậy. Không dễ để hưởng lợi từ các hiệu ứng quy mô khi bạn bán suy luận (inference). Mỗi giờ thêm và mỗi khách hàng mới đều cần cùng một lượng tính toán. Đó là lời nguyền của chi phí gia tăng trong dòng kinh doanh này.

Nhưng...

...có vẻ như Anthropic không thể xử lý quá nhiều khách hàng mới cùng một lúc, vì vậy tôi đã gỡ bỏ gánh nặng đó khỏi Anthropic và hủy tài khoản của mình.