Cloudflare ra mắt Code Mode MCP Server: Cách mạng hóa tương tác API và tiết kiệm token cho AI
Cloudflare vừa ra mắt máy chủ MCP mới sử dụng Code Mode, giúp các tác nhân AI tương tác với API hiệu quả hơn đáng kể. Giải pháp này giảm thiểu việc sử dụng token tới 99,9% so với phương pháp truyền thống, đồng thời cung cấp môi trường thực thi mã an toàn.

Cloudflare đã giới thiệu một bước tiến lớn trong cách các tác nhân AI (AI agents) truy cập vào các API phức tạp thông qua việc ra mắt máy chủ MCP (Model Context Protocol) mới được hỗ trợ bởi Code Mode. Động thái này giúp giảm đáng kể chi phí tương tác với toàn bộ nền tảng API của Cloudflare, đánh dấu một cách tiếp cận mới trong hệ sinh thái tích hợp tác nhân-công cụ.
Thách thức về chi phí Token trong MCP truyền thống
Về bản chất, MCP là một tiêu chuẩn đang nổi lên cho phép các mô hình ngôn ngữ lớn (LLM) giao tiếp với các công cụ và API bên ngoài. Theo phương pháp truyền thống, mỗi điểm cuối API (endpoint) được hiển thị cho tác nhân sẽ đại diện cho một định nghĩa công cụ riêng biệt. Mặc dù cách tiếp cận này đơn giản, nó lại gây ra chi phí lớn cho cửa sổ ngữ cảnh (context window) mỗi khi đặc tả công cụ tiêu thụ token trong giới hạn đầu vào của mô hình, khiến không gian dành cho suy luận về nhiệm vụ của người dùng bị thu hẹp.
Cloudflare Code Mode
Luuk Hofman, Kỹ sư giải pháp tại Cloudflare, chia sẻ: "Vì vậy, chúng tôi đã thử: chuyển đổi các công cụ MCP thành một API TypeScript và chỉ yêu cầu LLM viết code để tương tác với nó."
Giải pháp Code Mode: Tối ưu hóa bằng cách viết Code
Thay vì tải hàng ngàn định nghĩa điểm cuối vào ngữ cảnh, Code Mode của Cloudflare chỉ hiển thị hai công cụ: search() và execute(). Điều này được hỗ trợ bởi một SDK nhận biết kiểu dữ liệu, cho phép mô hình tạo và thực thi JavaScript bên trong một môi trường cô lập V8 an toàn.
Cách tiếp cận này biên dịch kế hoạch của tác nhân thành một đoạn mã nhỏ điều phối nhiều hoạt động đối với đặc tả OpenAPI, tránh nhu cầu tải tất cả các định nghĩa điểm cuối vào ngữ cảnh.
Tác động thực tế là rất lớn: Cloudflare báo cáo rằng Code Mode giảm lượng token cần thiết để tương tác với hơn 2.500 điểm cuối API từ hơn 1,17 triệu token xuống chỉ còn khoảng 1.000 token — mức giảm khoảng 99,9%. Dấu chân ngữ cảnh cố định này được duy trì bất kể kích thước bề mặt API, cho phép các tác nhân hoạt động trên các nền tảng lớn mà không làm cạn kiệt ngữ cảnh của mô hình.
Cơ chế hoạt động và Bảo mật
Quy trình hoạt động bắt đầu khi các tác nhân sử dụng search() để truy vấn đặc tả OpenAPI theo khu vực sản phẩm, đường dẫn hoặc siêu dữ liệu; chính đặc tả đó không bao giờ nhập vào ngữ cảnh của mô hình. Sau đó, execute() chạy mã xử lý phân trang, logic điều kiện và các lệnh gọi API chuỗi trong một chu kỳ duy nhất, cắt giảm chi phí vòng lặp.
Cloudflare đặc biệt nhấn mạnh mô hình bảo mật và "sandboxing" (hộp cát) trong quá trình thực thi. Máy chủ chạy mã do người dùng tạo trong một Dynamic Worker isolate không có hệ thống tệp, không có biến môi trường được hiển thị và các yêu cầu gửi đi được kiểm soát thông qua các trình xử lý rõ ràng. Thiết kế này giúp giảm thiểu rủi ro liên quan đến việc thực thi mã không đáng tin cậy trong khi vẫn giữ được quyền tự chủ của tác nhân.
Khả dụng và Tương lai
Máy chủ MCP mới này cho toàn bộ API của Cloudflare hiện đã bao gồm các dịch vụ DNS, Zero Trust, Workers và R2, sẵn sàng cho các nhà phát triển tích hợp. Cloudflare cũng đã mã nguồn mở một SDK Code Mode trong Agents SDK rộng lớn hơn của mình để cho phép các mô hình tương tự trong các triển khai MCP của bên thứ ba.
Các chuyên gia trong ngành nhìn nhận Code Mode là một bước đi then chốt trong việc mở rộng quy trình làm việc của các tác nhân AI vượt ra ngoài các tương tác dịch vụ đơn giản, hướng tới tự động hóa đa API phức tạp. Mô hình này có thể ảnh hưởng đến cả thiết kế máy chủ MCP tiêu chuẩn và các khung tác nhân trong năm tới, khi các công ty công nghệ giải quyết các vấn đề về chi phí ngữ cảnh và sự phức tạp trong việc điều phối các tác nhân AI cấp độ sản xuất.
Bài viết liên quan

Công nghệ
Dairy Queen tích hợp chatbot AI vào hệ thống drive-thru để tăng tốc độ phục vụ
17 tháng 4, 2026

Công nghệ
Nhà Trắng gặp gỡ Anthropic: Thảo luận về mô hình AI Mythos và rủi ro an ninh mạng
17 tháng 4, 2026

Công nghệ
Cursor đàm phán huy động hơn 2 tỷ USD với định giá 50 tỷ USD khi tăng trưởng doanh nghiệp bùng nổ
17 tháng 4, 2026
