Chuyển hướng ngân sách $100/tháng từ Claude Code sang Zed và OpenRouter để tối ưu hóa chi phí

Tác giả cảm thấy thất vọng vì giới hạn sử dụng của Claude Code dù trả phí $100/tháng. Giải pháp thay thế là chuyển sang sử dụng trình soạn thảo Zed với chi phí $10/tháng và nạp thêm $90 vào OpenRouter, giúp linh hoạt hơn trong việc lựa chọn mô hình AI và tích lũy số dư khi không sử dụng.

Thay vì trả $100/tháng cho Claude, tôi trả $10/tháng cho trình soạn thảo Zed và nạp thêm $90 vào OpenRouter. Bạn có thể sử dụng Zed Agent Harness hoặc tiếp tục dùng Claude Code, nhưng thay vào đó bạn sẽ trả phí API dựa trên lượng sử dụng thực tế. Khi không sử dụng, số tín dụng của bạn sẽ được cộng dồn thay vì bị mất đi như cửa sổ sử dụng định kỳ.

Tôi cảm thấy thất vọng khi nhận ra mình đang chạm đến giới hạn của Claude nhanh hơn trước. Để bạn dễ hình dung, tôi sử dụng cả Claude Code và ứng dụng desktop Claude cho công việc và trả $100/tháng chỉ để có quyền... chạm đến giới hạn đó. Tôi không phải là người duy nhất gặp tình trạng này (ngay cả Giám đốc AI cấp cao của AMD cũng vậy), và có rất nhiều báo cáo tương tự trên Reddit và Twitter.

Bài viết này sẽ chia sẻ cách tôi chuyển dịch ngân sách đó sang các công cụ và mô hình khác, đồng thời đạt được sự linh hoạt cao hơn.

Chọn Agent Harness và khám phá các mô hình khác

Tôi thích có nhiều lựa chọn. Mặc dù Opus chắc chắn là người dẫn đầu thị trường về lập trình tác nhân (agentic coding), nhưng có những mô hình khác tôi muốn sử dụng để cân bằng giữa chi phí và tốc độ, tùy thuộc vào độ phức tạp của nhiệm vụ. Tôi đang tìm cách sử dụng các mô hình khác nhau với một Agent Harness.

Agent Harness là hệ thống điều phối việc gửi và nhận tin nhắn từ các Mô hình Ngôn ngữ Lớn (LLM), chèn định nghĩa công cụ, gọi các công cụ đó và phối hợp tất cả vào quy trình làm việc (bao gồm cả việc thử lại các nhiệm vụ thất bại).

Claude Code là một ví dụ về hệ thống như vậy. Nó nhận tin nhắn của người dùng, điều phối việc đọc/ghi tệp - cùng các việc khác - và thực hiện cuộc gọi đến LLM.

Zed và OpenRouter

Kế hoạch giá: $10 / tháng

Bạn sẽ không nhận ra VSCode và các bản fork của nó chậm/lag đến mức nào cho đến khi bạn thử dùng Zed. Agent harness tích hợp sẵn của Zed khá cơ bản nhưng rất tốt, có khả năng theo dõi tác nhân khi nó sửa đổi tệp và thêm các cấu hình mới để tùy chỉnh hành vi của tác nhân. Giống như Cursor, nó hiển thị mức sử dụng ngữ cảnh và các quy tắc đang được áp dụng cho phiên hiện tại. Nếu bạn tiếp tục sử dụng Claude Code hoặc các công cụ khác như Mistral Vibe, Zed tích hợp chúng trực tiếp vào trình soạn thảo thông qua Agent Client Protocol (ACP).

Nhược điểm lớn nhất chắc chắn là thiếu các tiện ích mở rộng (extensions) so với VSCode, nhưng có đủ các tiện ích để bao phủ các ngôn ngữ và nhiệm vụ phổ biến.

Zed có áp dụng định giá dựa trên mức sử dụng sau khi bạn dùng hết tín dụng họ cung cấp, tuy nhiên giá token của họ cao hơn so với việc gọi trực tiếp đến API. Đó là lý do tôi thích sử dụng tích hợp OpenRouter vào Zed hơn. Một lợi ích phụ thú vị là bạn được kích thước cửa sổ ngữ cảnh (context window) gốc tự nhiên hơn. Vì lý do nào đó, Zed giới hạn ngữ cảnh Gemini 3.1 ở mức 200k token trong tích hợp gốc của họ, nhưng với OpenRouter, bạn có thể sử dụng tối đa 1M token. Tài liệu của họ cho biết điều này có thể thay đổi trong tương lai.

OpenRouter

Lựa chọn mô hình và nhà cung cấp lớn nhất mà tôi biết là OpenRouter. Việc đăng ký, nạp trước một số tín dụng và nhận khóa API khá dễ dàng.

Tôi không thích việc có một cửa sổ tín dụng cố định của Anthropic. Nếu tôi dùng hết, tôi phải đợi nó đặt lại (hoặc trả thêm tiền). Nhưng khi tôi không dùng, tôi lại mất đi cơ hội sử dụng trong khoảng thời gian đó. Thay vào đó, tôi có thể nạp thêm tín dụng OpenRouter, chúng sẽ hết hạn sau 365 ngày nếu không sử dụng. Sau đó, tôi có thể dùng tín dụng khi làm việc và tiết kiệm/dồn chúng khi không làm việc.

Để giảm thiểu rủi ro lộ dữ liệu, tôi đã chọn không đồng ý để OpenRouter sử dụng đầu vào/đầu ra "để cải thiện sản phẩm" (mặc dù bạn sẽ được giảm giá 1% nếu đồng ý), và tôi đã bật chế độ "Zero Data Retention (ZDR) Endpoints Only" trong cài đặt Workspace Guardrail của mình. Bạn sẽ mất một số mô hình ở đây - ví dụ, qwen/qwen3.6-plus chỉ được lưu trữ trên Alibaba Cloud - nhưng đó là cái giá nhỏ tôi sẵn lòng trả.

Cursor

Kế hoạch giá: $20 | $60 | $200 / tháng

Tôi ban đầu chuyển từ VSCode & Copilot sang Cursor vào năm 2025 sau khi trải nghiệm "phép thuật" của tính năng "Tab" của Cursor, khi nó nhảy quanh trình soạn thảo và đoán trước nước đi tiếp theo của tôi.

Khi nó chuyển từ tự động hoàn thành kiểu "doping" sang lập trình tác nhân hơn, tôi cảm thấy biết ơn vì có quyền truy cập vào nhiều mô hình để thử nghiệm (tính năng này hiện cũng có trong Copilot nhưng ban đầu họ chỉ dùng OpenAI).

Tôi hầu như bỏ qua Cursor 2.0 vì họ tập trung vào giao diện trò chuyện, tuy nhiên với Cursor 3.0 là một bản viết lại hoàn toàn (bằng Rust giống như Zed) và tập trung vào điều phối tác nhân (Agent orchestration), tôi rất tò mò muốn thử nghiệm.

Cursor từng là (và có thể vẫn bán là) trình soạn thảo ưa thích của tôi. Là một bản fork của VSCode, tất cả các tiện ích mở rộng đều có sẵn. Họ là người áp dụng sớm quy trình chế độ kế hoạch -> chế độ tác nhân và hiện hỗ trợ chế độ gỡ lỗi (debug mode) mới, một kiểu gỡ lỗi kiểu in (print style) nâng cao mà tác nhân cũng có thể tương tác.

Cursor cũng hỗ trợ các loại áp dụng quy tắc khác nhau, điều cá nhân tôi rất thích và ngạc nhiên là các agent harness khác chưa áp dụng. Hầu hết các agent harness áp dụng phương pháp "áp dụng thông minh", cố gắng để AI quyết định khi nào bao gồm một quy tắc dựa trên mô tả. Nhưng Cursor cũng cung cấp khả năng chỉ áp dụng cho các tệp cụ thể. Tôi biết tôi có các quy tắc chỉ áp dụng cho tệp *.py, hoặc thậm chí **/models.py, v.v. Tôi có thể tận dụng tối đa cửa sổ ngữ cảnh của mình bằng cách đặt rõ ràng các quy tắc đó chỉ được thêm vào các biểu thức đường dẫn tệp cụ thể. Nó đảm bảo việc sử dụng chúng.

Khi chọn Cursor, bạn sẽ nhận được định giá tỷ lệ API trên mức sử dụng bao gồm trong gói của mình (và bạn có thể giới hạn điều này để tổng chi phí bị giới hạn ở $100), nhưng bạn vẫn phải trả tối thiểu $20/tháng và số tiền này không được cộng dồn sang tháng tiếp theo.

Claude Code và OpenRouter

Claude Code được tối ưu hóa cho các mô hình của Anthropic và có thể không hoạt động chính xác với các nhà cung cấp khác.

Tôi biết - tôi đã nói là tôi đang chuyển tiền đi nơi khác chứ không phải Anthropic, nhưng vẫn có thể tiếp tục sử dụng Claude Code agent harness với các mô hình khác (hoặc thậm chí là Opus nếu bạn muốn). Chúng ta có thể muốn làm điều này vì Claude Code không thể phủ nhận là một harness tuyệt vời, tuy nhiên chúng ta cần cấu hình Claude Code để sử dụng OpenRouter thay vì Anthropic API.

Đầu tiên, đăng xuất khỏi Claude Code nếu bạn đã sử dụng nó trước đó:

claude
> /logout

Tiếp theo, đặt một số biến môi trường để cấu hình các điểm cuối OpenRouter và các mô hình bạn muốn sử dụng cho "Opus", "Sonnet", "Haiku" và "SubAgents" (tôi khuyên bạn nên đặt các biến này trong tệp ~/.zshrc hoặc ~/.bashrc của bạn để chúng tồn tại):

export OPENROUTER_API_KEY=""
export ANTHROPIC_BASE_URL="https://openrouter.ai/api"
export ANTHROPIC_AUTH_TOKEN="$OPENROUTER_API_KEY"
export ANTHROPIC_API_KEY="" # Quan trọng: Phải để trống rõ ràng
# Đặt các mô hình này thành bất kỳ mô hình nào bạn muốn sử dụng trên OpenRouter
export ANTHROPIC_DEFAULT_OPUS_MODEL="anthropic/claude-opus-4.6"
export ANTHROPIC_DEFAULT_SONNET_MODEL="anthropic/claude-sonnet-4.6"
export ANTHROPIC_DEFAULT_HAIKU_MODEL="anthropic/claude-haiku-4.5"
export CLAUDE_CODE_SUBAGENT_MODEL="anthropic/claude-opus-4.6"

Xác minh rằng Claude Code đang sử dụng cấu hình mới của bạn (bạn có thể cần khởi động lại terminal hoặc source ~/.zshrc):

claude
> /status
Auth token: ANTHROPIC_AUTH_TOKEN
Anthropic base URL: https://openrouter.ai/api

Các công cụ CLI khác như OpenCode + OpenRouter

Có vô số Coding Agent Harness khác có thể được sử dụng từ dòng lệnh với OpenRouter. Tôi đã thử một vài cái nhưng không cái nào bám được lâu, đây là danh sách để bạn thử và suy nghĩ ngắn gọn của tôi về chúng:

OpenCode - Typescript - Cái tôi dùng nhiều nhất. Hỗ trợ tốt cho nhiều thứ. Rất phổ biến.
Crush - Go - Tôi muốn thích nó. Nó có sự lựa chọn phong cách riêng biệt (mà tôi không phiền). Nó hoạt động hiệu quả. Nhưng việc cấu hình các mô hình tùy chỉnh rất đau đớn (tất cả đều thủ công) nên rất phiền phức khi thử nghiệm cái mới.

Ngay cả với các công cụ phổ biến thường giới hạn bạn sử dụng mô hình của riêng họ như Gemini CLI, thường có các bản fork cố gắng làm cho chúng tương thích với OpenRouter. Điều này đáng để kiểm tra nếu bạn đang sử dụng và thích một harness khác nhưng muốn thử các mô hình khác.

Bây giờ, tôi là một người đăng ký hài lòng của Zed với mức giá hợp lý $10/tháng. Thực tế, tôi vẫn duy trì đăng ký Cursor với giá $20/tháng vì tôi muốn xem họ sẽ đi đâu với Cursor 3 và bộ điều phối tác nhân mới. $70 còn lại sẽ được tự động thêm vào tín dụng OpenRouter của tôi mỗi tháng và không bị mất đi. Chúng được cộng dồn, chờ tôi sử dụng.

Nếu bạn thường xuyên chạm đến giới hạn của Claude và muốn thử các mô hình khác (nhưng vẫn có thể dùng Opus khi cần), tôi rất khuyên bạn nên thử. Bạn có thể bắt đầu với Zed miễn phí và nạp $20 tín dụng vào OpenRouter mà không cần đăng ký bất kỳ gói nào.