Cursor 3 tung ra các Agent song song, nhưng liệu có gì thực sự mới mẻ?

Cursor 3 vừa ra mắt với tính năng chạy song song 8 AI agent trên các Git worktree riêng biệt, gây tiếng vang lớn trên cộng đồng công nghệ. Tuy nhiên, dưới bề mặt hào nhoáng là những lo ngại lớn về chi phí ẩn không minh bạch và thực tế rằng khả năng thực thi song song này vốn đã có từ trước. Bài viết phân tích sâu về hiệu quả thực tế, bài toán chi phí và những thách thức kỹ thuật khi chia sẻ ngữ cảnh giữa các agent.

Cursor 3 đã ra mắt vào ngày 2 tháng 4. Các bản demo trông rất ấn tượng: 8 AI agent chạy song song, mỗi cái trong một Git worktree riêng biệt, cùng lúc xây dựng các phần khác nhau của dự án. Chủ đề trên Hacker News bùng nổ ngay lập tức và Product Hunt đã xếp nó ở vị trí số 3 trong ngày.

Nhưng khi tôi đọc kỹ các bình luận, một bức tranh khác hiện ra. Một người dùng báo cáo đã tiêu tốn 2.000 USD chỉ trong hai ngày cho các cloud agent. Một người khác đã chuyển từ mức giá 1.800 USD/tháng trên Cursor xuống còn khoảng 200 USD/tháng khi sử dụng Claude Code và Codex. Người thứ ba thì nói họ "hoàn toàn không hứng thú" với việc bị buộc phải sử dụng bầy agent và đang chuyển sang VS Code với Claude Code.

Hầu hết các bài viết cho đến nay chỉ là tóm tắt lại các tính năng dựa trên thông cáo báo chí. Ít ai đặt ra những câu hỏi hiển nhiên: việc thực thi agent song song có thực sự mới không? Chi phí thực tế là bao nhiêu? Và điều gì sẽ xảy ra khi các agent của bạn cần chia sẻ ngữ cảnh với nhau?

Điểm mấu chốt ở đây Cursor 2 thực tế đã hỗ trợ thực thi song song thông qua cấu hình worktree.json. Điều mà Cursor 3 thực sự mang lại chỉ là một lớp giao diện người dùng (UI) – bao gồm thanh bên Agents Window và các tab kéo thả – nằm trên cùng các nguyên thủy Git worktree cũ. Vấn đề chi phí mới là mối lo ngại thực sự: những người dùng thử nghiệm sớm báo cáo hóa đơn 2.000 USD chỉ trong hai ngày, trong khi trang giá cả của Cursor không giải thích tại sao. Vấn đề kỹ thuật chưa được giải quyết là chia sẻ ngữ cảnh giữa các agent nội bộ và trên đám mây, mà tài liệu chỉ giải thích hời hợt là "được tóm tắt và giảm thiểu".

Cursor 3 thực tế đã cung cấp những gì?

Cursor 3 cho phép bạn chạy tối đa 8 AI agent song song trên các Git worktree bị cô lập. Các agent này có thể chạy cục bộ thông qua Composer 2 hoặc trong các máy ảo (VM) cô lập trên đám mây. Bạn có thể quan sát tất cả từ một thanh bên mới gọi là Agents Window.

Đó là cách họ tiếp thị, bất chấp thực tế.

Cursor 2 trước đó đã hỗ trợ thực thi agent song song thông qua cấu hình worktree.json. Lệnh /worktree không phải là chức năng mới. Đó là giao diện mới. Agents Window mang lại khả năng hiển thị những gì agent của bạn đang làm, và phần này thực sự hữu ích. Nhưng gọi đây là một bước ngoặt kiến trúc thì có vẻ hơi quá.

Các bổ sung khác bao gồm: /best-of-n chạy cùng một lời nhắc trên nhiều mô hình song song (so sánh Composer 2, Claude và GPT). Design Mode cho phép bạn chú thích các yếu tố UI và mô tả các thay đổi bằng tiếng Anh thuần túy. MCP Marketplace thêm hỗ trợ plugin cho hàng trăm công cụ.

Bên dưới bề mặt, /worktree chạy lệnh git worktree add để tạo một thư mục làm việc cô lập trên nhánh mới, sau đó kích hoạt một quy trình agent phạm vi trong thư mục đó. Mỗi agent có chế độ xem hệ thống tệp riêng, để các chỉnh sửa tệp không xung đột trong quá trình chạy. Khi agent hoàn thành, bạn xem xét sự khác biệt (diff) và hợp nhất (merge). Đây chính xác là những gì bạn sẽ làm thủ công với git worktree add và một terminal thứ hai. Cursor 3 gói gọn nó trong một thanh bên tiện lợi hơn.

Vấn đề chi phí mà không ai đang nói đến

Những người dùng sớm đã báo cáo chi tiêu hơn 2.000 USD trong hai ngày khi chạy các cloud agent của Cursor 3. Đó không phải là lỗi đánh máy. Hai ngàn đô la. Trong hai ngày.

Trang giá của Cursor liệt kê bốn cấp độ: Free, Pro với giá 20 USD, Pro+ với giá 60 USD và Ultra với giá 200 USD mỗi tháng. Những con số này trông có vẻ hợp lý cho đến khi bạn bắt đầu chạy các cloud agent. Trang giá cả không đề cập đến phí tính theo phút cho máy ảo hay giải thích cách tính phí cloud agent. Chi phí tài nguyên cho cloud agent? Hoàn toàn vắng bóng trên trang web.

Người dùng dirtbag__dad trên HN báo cáo đã chi tiêu "2k mỗi tuần với các mô hình cao cấp" trước khi chuyển sang Claude Code Max với "mức giá rẻ hơn 1/10". Một người bình luận khác, verelo, đã chuyển từ 1.800 USD/tháng trên Cursor xuống khoảng 200 USD/tháng khi sử dụng Claude và Codex, và gọi đây là "giá trị đồng tiền tốt hơn nhiều".

Câu chuyện lặp đi lặp lại giống nhau. Giá niêm yết và chi tiêu thực tế gần như không liên quan gì đến nhau. Khi trang giá của bạn nói 200 USD/tháng nhưng người dùng thường xuyên chi tiêu gấp 10 lần con số đó, vấn đề không nằm ở giá cả. Vấn đề là không ai có thể dự đoán bất cứ thứ gì tốn bao nhiêu cho đến khi hóa đơn được gửi đến.

Claude Code cũng không miễn nhiễm

Tôi cần công bằng ở đây. Các gói giá cố định của Anthropic nghe có vẻ dễ dự đoán, nhưng họ cũng có phiên bản vấn đề của riêng mình.

Vào cuối tháng 3 năm 2026, người dùng gói Claude Code Max báo cáo đã cạn hạn ngạch (quota) trong chưa đầy một giờ. Cùng hạn ngạch mà trước đây họ dùng được trong 8 giờ. Câu chuyện này đã đạt 324 điểm trên Hacker News và BBC đưa tin một ngày sau đó.

Anthropic đã thừa nhận vấn đề trên Reddit: "mọi người đang chạm đến giới hạn sử dụng trong Claude Code nhanh hơn nhiều so với mong đợi". Một chương trình khuyến mãi tháng 3 đã nhân đôi giới hạn sử dụng và kết thúc vào ngày 28 tháng 3. Có báo cáo về các lỗi bộ nhớ đệm (prompt cache) làm tăng mức sử dụng token lên 10-20 lần. Và Anthropic không công khai chỉ định chính xác giới hạn sử dụng cho bất kỳ gói nào.

Vì vậy, mọi người bắt đầu xây dựng các công cụ chỉ để tìm ra giới hạn của chính mình. Các bộ chặn API proxy. Một nhà phát triển đã cố gắng giải mã ngược các tiêu đề sử dụng mà Anthropic gửi trên mỗi phản hồi API, bởi vì Claude Code không hiển thị chúng cho bạn.

Tôi đã xây dựng Claudoscope một phần vì lý do này. Nếu công cụ không cho bạn biết nó tốn bao nhiêu, hãy tự xây dựng một cái mà làm được điều đó.

Cả hai công cụ đều có vấn đề về tính minh bạch chi phí. Chúng chỉ được cấu trúc khác nhau. Vấn đề của Cursor là sự mù mờ theo token: bạn không biết cloud agent sẽ tốn bao nhiêu cho đến khi hóa đơn đến. Vấn đề của Anthropic là các giới hạn không được công bố trên các gói được tiếp thị là hào phóng. Không bên nào figured out điều này yet, điều này khá đáng kinh ngạc given mức phí họ thu.

Vấn đề chia sẻ ngữ cảnh

Đây là khoảng trống kỹ thuật mà ít ai viết về, nhưng lại là thứ thực sự quan trọng đối với việc các agent song song hoạt động hiệu quả trong thực tế.

Mỗi agent worktree chạy trên nhánh bị cô lập riêng của nó. Đó là điểm mấu chốt: sự cô lập ngăn ngừa xung đột tệp. Nhưng nó cũng có nghĩa là Agent A không biết Agent B đang làm gì. Nếu bạn đang xây dựng một điểm cuối API trong một worktree và giao diện người dùng gọi nó trong một worktree khác, những agent này đang làm việc từ cùng một lần cam kết (commit) cơ sở. Không cái nào thấy những thay đổi đang thực hiện của cái kia.

Tài liệu của Cursor nói rằng ngữ cảnh giữa các agent nội bộ và trên đám mây được "tóm tắt và giảm thiểu" trước khi chia sẻ. Câu văn này đang phải làm quá nhiều việc. Có bao nhiêu phần trăm của một cơ sở mã 100.000 dòng tồn tại sau khi tóm tắt? Ngân sách token cho bản tóm tắt là bao nhiêu? Nó là bản tóm tắt nhận thức AST đầy đủ hay chỉ là danh sách đường dẫn tệp? Tài liệu không nói.

Cũng có câu hỏi về trạng thái đã cam kết (committed) so với chưa cam kết (dirty). Liệu các cloud agent đang làm việc từ trạng thái đã cam kết mới nhất trên nhánh, hay từ các chỉnh sửa chưa cam kết cục bộ của bạn? Nếu là đã cam kết: bạn phải cam kết trước khi kích hoạt cloud agent, điều này có nghĩa là mã chưa hoàn thành sẽ xuất hiện trong lịch sử Git của bạn. Nếu chưa cam kết: chúng cần đồng bộ hóa hệ thống tệp giữa cục bộ và đám mây, điều này giới thiệu độ trễ và vấn đề nhất quán. Tài liệu cũng im lặng về điều này.

Tôi đã gặp phiên bản vấn đề này với tính năng song song worktree của Claude Code. Hai agent xây dựng dựa trên cùng một hợp đồng API đôi khi sẽ phân kỳ về tên trường hoặc hình dạng phản hồi vì không có agent nào thấy công việc của agent kia cho đến lúc hợp nhất. Cách khắc phục là thủ công: định nghĩa hợp đồng trước, cam kết nó, sau đó song song hóa. Cách này hoạt động, nhưng nó có nghĩa là sự song song thực sự đòi hỏi sự lập kế hoạch trước, làm mất đi thời gian tiết kiệm được.

Lần rò rỉ mã nguồn Claude Code đã phơi bày cách cách điều phối (orchestration) agent của họ xử lý việc này nội bộ: kích hoạt các tác nhân phụ, các gọi công cụ (tool call) xếp tầng qua các lớp điều phối, các phiên thử lại các hoạt động thất bại trong các vòng lặp. Việc chia sẻ ngữ cảnh giữa các agent là một vấn đề chưa được giải quyết trên toàn bộ danh mục sản phẩm, không chỉ riêng Cursor.

Các agent song song thực sự giải quyết được gì (và khi nào thì không)

Các agent song song mang lại tăng tốc thực sự cho đúng loại công việc. Xây dựng một tính năng full-stack với các thành phần tách rời? Bốn agent song song (UI, API, cơ sở dữ liệu, kiểm thử) có thể cắt giảm thời gian thực từ tám giờ xuống còn hai giờ. Đó là mức tăng 4x thực tế trên giấy tờ.

Tôi sử dụng tính năng song song dựa trên worktree của Claude Code cho các quy trình làm việc tương tự. Kích hoạt nhiều agent, mỗi cái trong một nhánh bị cô lập, hợp nhất khi chúng hoàn thành. Trải nghiệm người dùng (UX) thô hơn: không có Agents Window, không có tab kéo thả, không có trạng thái trực quan cái nhìn qua. Nhưng khả năng cốt lõi là giống nhau và chi phí cố định.

Đây là nơi nó thất bại. Khi Agent B phụ thuộc vào đầu ra của Agent A, bạn không thể song song hóa. Đó là phần lớn công việc thực tế. Đối với các tác vụ dưới 30 phút, chi phí điều phối sẽ ăn hết phần tăng tốc. Các nhà phát triển độc lập (solo devs) trên các dự án nhỏ gần như không nhận được gì từ việc chạy tám agent cùng lúc. Và khoảng trống chia sẻ ngữ cảnh mà tôi mô tả ở trên có nghĩa là các agent làm việc trên các thành phần liên quan sẽ phân kỳ trừ khi bạn đã thực hiện công việc hợp đồng trước đó.

Cursor 3 là một lớp giao diện được bóng bẩy trên các khả năng hiện có, được định vị là một bước đột phá kiến trúc. Các agent song song là có thật nhưng không mới. Mô hình chi phí là có thật nhưng không minh bạch.

Nếu bạn đã dùng Claude Code, tôi không thấy lý do để chuyển đổi. Nếu bạn đang đánh giá lần đầu, hãy thử cả hai. Chạy từng cái trong một tuần trên công việc thực tế, không phải bản demo. Theo dõi những gì bạn thực sự chi tiêu. Sau đó hãy quyết định.

Hoặc bỏ qua cả hai và thử ForgeCode. Nó là mã nguồn mở, dựa trên terminal, và đứng đầu TermBench 2.0 ở mức 81,8%. Bạn tự mang khóa API và chọn mô hình của mình. Tôi chưa dùng nó yet, nhưng tôi sẽ dành cuối tuần để thử. Bài đăng trên blog của họ về việc đạt vị trí số 1 có tiêu đề là "benchmark không quan trọng", điều mà tôi somewhat nể phục.

Đó thực sự là tất cả những gì tôi có. Hãy theo dõi chi phí của bạn. Phần còn lại sẽ tự giải quyết.

Các câu hỏi thường gặp

Cursor 3 thực sự tốn bao nhiêu mỗi tháng?

Các gói bắt đầu từ 20 USD/tháng nhưng chi tiêu thực tế với cloud agent dao động từ 200 đến hơn 1.800 USD/tháng dựa trên báo cáo từ cộng đồng Hacker News. Chi phí tài nguyên cloud agent không được tiết lộ trên trang giá cả. Hãy theo dõi chi tiêu thực tế của bạn trong một tuần đầy đủ trước khi cam kết vào một gói.

Bạn có thể chạy các agent Cursor 3 cục bộ mà không tốn chi phí đám mây không?

Có, các agent cục bộ chạy Composer 2 trên thiết bị mà không tính phí sử dụng. Tuy nhiên, các cloud agent là nơi thực thi song song thực sự có ý nghĩa, và chi phí cho các agent đó không được tiết lộ ở bất cứ đâu.

Cursor 3 có tốt hơn Claude Code cho các tác vụ song song không?

Claude Code hỗ trợ thực thi song song thông qua worktrees với mức giá cố định 100-200 USD/tháng. Cursor 3 cung cấp khả năng điều phối trực quan tốt hơn thông qua Agents Window nhưng với chi phí khó dự đoán. Hãy lựa chọn dựa trên điều quan trọng hơn với bạn: khả năng hiển thị UI hay khả năng dự đoán chi phí.