MCP giải quyết gọi công cụ, A2A giải quyết điều phối. Vậy ai sẽ giải quyết vấn đề truyền tải?
Lịch sử máy tính phân tán thường đi từ bùng nổ giao thức đến sự hợp nhất tiêu chuẩn. Hiện nay hệ sinh thái AI Agent đang trong giai đoạn bùng nổ với MCP, A2A, ACP và ANP; trong khi tầng ứng dụng đã dần ổn định, bài toán lớn nhất còn lại nằm ở tầng truyền tải (transport) để hỗ trợ kết nối trực tiếp giữa các agent.

Lịch sử của máy tính phân tán là chuỗi những giai đoạn bùng nổ các giao thức, sau đó là sự hợp nhất và củng cố. Vào cuối những năm 1990, CORBA, DCOM, RMI và các phiên bản đầu của SOAP đã cạnh tranh gay gắt trên thị trường tích hợp doanh nghiệp trước khi REST chiến thắng thầm lặng nhờ sự đơn giản và tính bản địa của HTTP. Tương tự, XMPP, IRC và hàng chục giao thức độc quyền từng phân mảnh lĩnh vực nhắn tin thời gian thực trước khi MQTT và WebSockets chiếm lĩnh thị trường ngách của mình. Mọi mô hình tính toán mới đều tạo ra một loạt các tiêu chuẩn cạnh tranh, sau đó dần hội tụ khi các triển khai thực tế tích lũy đủ và tính tương tác trở thành nhu cầu kinh tế cấp thiết.
Hệ sinh thái AI Agent hiện tại đang ở giai đoạn bùng nổ. Trong vòng mười tám tháng qua, bốn giao thức lớn đã được công bố: Model Context Protocol (MCP) từ Anthropic vào cuối năm 2024, Agent Communication Protocol (ACP) từ IBM Research vào tháng 3 năm 2025, Agent2Agent (A2A) từ Google vào tháng 4 năm 2025, và Agent Network Protocol (ANP) từ một nhóm công tác độc lập. Nhóm cộng đồng Giao thức AI Agent của W3C đã mở một lộ trình tiêu chuẩn hóa. IETF đang nhận các bản dự thảo Internet về truyền tải agent. Các hội nghị công nghệ đang tổ chức các hội thảo về khả năng tương tác. Mỗi tuần lại có một kho lưu trữ GitHub mới xuất hiện khẳng định giải quyết được vấn đề giao tiếp giữa các agent.
Việc hiểu rõ nơi đâu và tốc độ nhanh như thế nào sự hội tụ này diễn ra sẽ có những hệ quả thực sự đối với các quyết định kiến trúc đang được đưa ra ngay lúc này.
Các giao thức thực sự giải quyết vấn đề gì
Sự bùng nổ này có vẻ hỗn loạn hơn thực tế, bởi vì phần lớn các giao thức này giải quyết các tầng khác nhau của một ngăn xếp công nghệ (stack) thay vì cạnh tranh cho cùng một vị trí. Sự nhầm lẫn đến từ hoạt động tiếp thị, nơi mỗi giao thức được mô tả là "tiêu chuẩn cho giao tiếp AI Agent" mà không cụ thể hóa khía cạnh nào của giao tiếp.
- MCP là giao diện gọi công cụ (tool-calling interface). Nó định nghĩa cách một mô hình khám phá các chức năng mà máy chủ cung cấp, cách gọi chúng và cách diễn giải phản hồi. Đây là một hợp đồng gọi thủ tục từ xa (RPC) có kiểu dữ liệu giữa máy khách mô hình và máy chủ công cụ, chạy trên HTTP. Đến tháng 4 năm 2026, Linux Foundation đã xác nhận có hơn 10.000 máy chủ MCP công khai hoạt động và 164 triệu lượt tải xuống SDK Python mỗi tháng. MCP về cơ bản đã chiến thắng ở tầng gọi công cụ. Công việc chuẩn hóa hiệu quả đã hoàn tất.
- A2A là giao diện điều phối nhiệm vụ. Nơi MCP định nghĩa cách một agent gọi một công cụ, A2A định nghĩa cách hai agent ủy quyền một nhiệm vụ cho nhau. Nó giới thiệu Agent Cards (quảng cáo khả năng), các trạng thái vòng đời nhiệm vụ và ba chế độ tương tác: Đồng bộ, luồng (streaming) và không đồng bộ. Google đã quyên góp giao thức này cho Linux Foundation vào tháng 6 năm 2025, và các đội ngũ AI doanh nghiệp đã áp dụng rộng rãi vì nó lấp đầy một khoảng trống thực sự mà MCP để ngỏ.
- ACP là định dạng bao bọc tin nhắn. Nhẹ, không trạng thái (stateless), được thiết kế để trao đổi tin nhắn từ agent này sang agent khác mà không có ngữ nghĩa điều phối đầy đủ của A2A. Nó hữu ích trong các hệ thống nơi việc chuyển tin nhắn đơn giản là đủ và chi phí overhead vòng đời nhiệm vụ của A2A là không cần thiết.
- ANP là giao thức phát hiện và danh tính. Nó sử dụng Bộ định danh Phi tập trung (DIDs) cho danh tính agent và đồ thị JSON-LD cho mô tả khả năng, cung cấp nền tảng cho các chợ agent phi tập trung nơi không cần sổ đăng ký trung tâm.
Ngăn xếp đang hình thành là: Phát hiện khả năng thông qua ANP hoặc sổ đăng ký đơn giản hơn, điều phối nhiệm vụ qua A2A, gọi công cụ qua MCP, và nhắn tin nhẹ qua ACP cho các trường hợp không cần quản lý vòng đời nhiệm vụ đầy đủ. Các tầng này bổ sung cho nhau thay vì cạnh tranh.
Vấn đề truyền tải vẫn còn bỏ ngỏ
Mọi giao thức trong danh sách này đều chạy trên HTTP. Điều này phản ánh nguồn gốc của chúng: Các nhóm nghiên cứu, nhà cung cấp API và các công ty phần mềm doanh nghiệp đang xây dựng hệ thống nơi HTTP là một giả định không thể bàn cãi. HTTP là giao thức họ biết, giao thức mà máy chủ của họ đã "nói", và giao thức giúp việc demo trở nên dễ dàng.
Tuy nhiên, vấn đề trong môi trường sản xuất là HTTP giả định sự tồn tại của một máy chủ có thể truy cập được. Đằng sau Chuyển đổi địa chỉ mạng (NAT) — và 88% các thiết bị mạng nằm sau NAT — không có máy chủ nào có thể truy cập được mà không qua một trung chuyển (relay). Đối với các đội agent cần định tuyến nhiệm vụ trực tiếp giữa các ngang hàng (peer) xuyên qua các ranh giới đám mây, mạng gia đình và triển khai biên, sự tập trung hóa này buộc mọi tin nhắn phải đi qua cơ sở hạ tầng trung chuyển. Cơ sở hạ tầng trung chuyển thêm độ trễ, chi phí và một dạng thất bại tiềm ẩn.
Các giao thức tầng ứng dụng giải quyết ngữ nghĩa của việc các agent nói gì với nhau. Chúng không giải quyết cách các agent tìm thấy nhau và thiết lập kết nối trực tiếp. Đó là một vấn đề của tầng phiên (session-layer), Tầng 5 trong mô hình OSI, và không có MCP, A2A, ACP hay ANP nào giải quyết nó.
Các công nghệ để giải quyết vấn đề này đã tồn tại. UDP hole-punching với STUN cung cấp khả năng xuyên NAT cho khoảng 70% cấu trúc mạng. X25519 Diffie-Hellman và AES-256-GCM cung cấp mã hóa xác thực ở cấp độ đường hầm mà không cần chứng chỉ quyền hạn. Quick UDP Internet Connections (QUIC) hoặc các giao thức cửa sổ trượt tùy chỉnh qua UDP cung cấp chuyển giao đáng tin cậy mà không bị chặn đầu dòng (head-of-line blocking) của TCP. Đây là những nguyên mẫu cơ bản mà WireGuard sử dụng cho các đường hầm VPN và WebRTC sử dụng cho các luồng media từ trình duyệt đến trình duyệt.
Điểm khác biệt trong bối cảnh agent là định tuyến dựa trên khả năng (capability-based routing). Agent cần tìm ngang hàng không phải bằng tên máy chủ (hostname) mà bằng những gì ngang hàng đó có thể làm. Một agent nghiên cứu nên có thể truy vấn "những ngang hàng nào có dữ liệu ngoại tệ thời gian thực?" và nhận được danh sách các agent chuyên gia đang hoạt động. Điều này gần giống với sổ đăng ký dịch vụ hơn là DNS, và là một mở rộng tự nhiên của triết lý thiết kế của ANP áp dụng cho tầng truyền tải.
Một số ít dự án đang lắp ráp các mảnh ghép này. Pilot Protocol có thông số kỹ thuật được công bố hoàn chỉnh nhất, với một bản dự thảo Internet của IETF bao gồm định chỉ, thiết lập đường hầm và xuyên NAT cho mạng agent. libp2p cung cấp nền tảng đã được kiểm chứng với các nguyên mẫu tương tự. Nhóm làm việc QUIC của IETF đang phát triển các mở rộng xuyên NAT sẽ có liên quan ở đây.
Sự hội tụ sẽ diễn ra như thế nào
Các giao thức dựa trên HTTP (MCP, A2A) đang hội tụ về các phiên bản ổn định. 12 tháng tới sẽ chứng kiến sự cố định sản xuất, cải tiến bảo mật, máy chủ MCP không trạng thái để mở rộng quy mô ngang, và liên kết A2A tốt hơn — thay vì các thiết kế cơ bản mới. Các tầng gọi công cụ và điều phối nhiệm vụ về cơ bản đã được giải quyết.
Tầng truyền tải đang chậm hơn 18 đến 24 tháng. Hãy kỳ vọng một giai đoạn đa dạng trong triển khai khi các đội ngũ thử nghiệm các cách tiếp cận khác nhau cho mạng lưới agent ngang hàng (P2P), sau đó là sự hợp nhất xung quanh một số nhỏ triển khai khi dữ liệu thực nghiệm về hiệu suất và độ tin cậy được tích lũy. Các lộ trình tiêu chuẩn hóa của IETF và W3C có thể sẽ tạo ra kết quả nào đó trong giai đoạn 2027-2028, lúc đó một hoặc hai triển khai mã nguồn mở sẽ tích lũy đủ triển khai sản xuất để thiết lập các tiêu chuẩn de facto trước cả thông số kỹ thuật chính thức.
Đối với các lãnh đạo kỹ thuật đang đưa ra quyết định kiến trúc ngày nay, hàm ý thực tế là áp dụng từng tầng. Các giao thức tầng ứng dụng đủ ổn định để xây dựng dựa trên đó. Việc áp dụng MCP ngay bây giờ là rủi ro thấp. Việc áp dụng A2A cho điều phối đa agent là hợp lý với kỳ vọng rằng giao thức sẽ tiến hóa. Tầng truyền tải là nơi bạn hoặc xây dựng một thứ gì đó tùy chỉnh và lên kế hoạch thay thế nó, hoặc đánh giá các triển khai sớm khi biết rằng không gian này vẫn đang chuyển động.
Những đội ngũ có sức ảnh hưởng nhất khi tầng truyền tải ổn định sẽ là những đội ngũ đã thiết kế hệ thống agent của họ với sự tách biệt rõ ràng giữa ngữ nghĩa ứng dụng (MCP, A2A) và truyền tải (bất kỳ thứ gì nằm dưới). Sự tách biệt rõ ràng này rẻ để thực hiện ngay bây giờ và rất tốn kém để sửa đổi lại sau đó — một bài học mà thời đại vi dịch vụ (microservices) đã dạy cho bất kỳ ai từng cố gắng thêm khả năng quan sát hoặc cắt mạch (circuit breaking) vào các hệ thống vốn không có những thứ đó.
Philip Stayetski là đồng sáng lập của Vulture Labs.



