Startup BAND giới thiệu "người điều phối toàn cầu" giúp các tác nhân AI giao tiếp với nhau
Startup BAND vừa huy động 17 triệu USD để xây dựng hạ tầng giao tiếp giữa các tác nhân AI, giải quyết vấn đề phân mảnh trong hệ sinh thái hiện tại. Nền tảng này hoạt động như lớp trung gian cho phép các tác nhân từ các khung và đám mây khác nhau phối hợp công việc một cách an toàn và hiệu quả. BAND hướng tới việc chuẩn hóa giao tiếp giữa các AI để thúc đẩy nền kinh tế tác nhân tự chủ.

Trong mười tám tháng qua, giới doanh nghiệp đã chú trọng vào giai đoạn "xây dựng" của cuộc cách mạng AI tạo sinh (Generative AI). Các doanh nghiệp đã đua nhau triển khai các tác nhân tự chủ (autonomous agents) để xử lý mọi thứ từ hỗ trợ khách hàng đến việc tái cấu trúc mã nguồn phức tạp.
Tuy nhiên, khi những công nhân kỹ thuật số này ngày càng nhiều lên, một vấn đề mang tính cấu trúc hơn đã xuất hiện: sự phân mảnh. Các tác nhân được xây dựng trên LangChain không thể dễ dàng chuyển giao nhiệm vụ cho những tác nhân chạy trên CrewAI; một tác nhân nhúng trong Salesforce không có cách thức gốc để phối hợp với một tập lệnh Python tùy chỉnh chạy trên đám mây riêng.
Hôm nay, một startup mới tên là BAND (còn được gọi là Thenvoi AI Ltd.) đã công khai mình sau giai đoạn phát triển kín với khoản tài trợ hạt giống (Seed funding) là 17 triệu USD. Mục tiêu của họ là cung cấp "hạ tầng tương tác" cần thiết để biến những công cụ cô lập này thành một lực lượng lao động hợp nhất và cộng tác.
"Để các tác nhân trở thành những người chơi thực sự trong nền kinh tế toàn cầu, chúng cần có cách giao tiếp, giống như con người vậy", Arick Goomanovsky, đồng sáng lập và CEO của BAND, chia sẻ trong một cuộc phỏng vấn với VentureBeat. Ông tiếp tục: "Các giải pháp giao tiếp chúng ta có hôm nay cho các hệ thống không hoạt động được với các tác nhân, vì các tác nhân là những sinh vật phi xác định (non-deterministic). Vấn đề không chỉ là tích hợp API đâu."
Bằng cách giới thiệu một lớp giao tiếp xác định hoạt động như một "Slack dành cho các tác nhân", BAND aims để đưa ngành công nghiệp từ một tập hợp các thử nghiệm mong manh sang một "nền kinh tế tác nhân" có thể mở rộng quy mô.
Giới thiệu "Agentic Mesh" (Lưới tác nhân)
Cốt lõi của luận điểm của BAND là việc chỉ đơn thuần tạo và cắm các tác nhân AI vào các công cụ giao tiếp của con người như Slack sẽ khiến chúng mất ngữ cảnh hoặc yêu cầu "tái hydrat hóa" (rehydration) liên tục nếu chúng gặp sự cố và tham gia lại cuộc trò chuyện.
"Bạn không thể lấy một bunch các tác nhân và ném chúng vào Slack rồi mong muốn mọi thứ sẽ hoạt động một cách kỳ diệu", Goomanovsky nói.
BAND giải quyết vấn đề này thông qua kiến trúc hai lớp được thiết kế để xử lý số liệu thống kê độc đáo của sự tương tác AI với AI, hay còn gọi là "agentic mesh".
Đây là "lớp tương tác" nơi phát hiện tác nhân và ủy quyền có cấu trúc diễn ra. Nó cho phép các tác nhân tìm thấy nhau qua các đám mây và khung khác nhau mà không yêu cầu các nhà phát triển viết "mã keo" (glue code) mong manh cho mỗi kết nối mới.
- Hợp tác đa đồng thời (Multi-Peer Collaboration): Không giống như các giao thức hiện nay chủ yếu là điểm-điểm hoặc máy chủ-máy khách, BAND hỗ trợ giao tiếp song công full-duplex và đa đồng thời. Điều này cho phép một nhóm tác nhân — ví dụ: một tác nhân lập kế hoạch, một tác nhân viết mã, và một tác nhân QA — làm việc cùng nhau trong một "phòng" chung với ngữ cảnh được đồng bộ hóa.
- Định tuyến xác định (Deterministic Routing): Đáng chú ý, BAND không sử dụng Mô hình Ngôn ngữ Lớn (LLM) để định tuyến tin nhắn. Việc sử dụng LLM để định tuyến sẽ giới thiệu các lỗi phi xác định tương tự mà nền tảng này tìm cách giải quyết. Thay vào đó, nền tảng sử dụng kiến trúc nhiều lớp đang được cấp bằng sáng chế để đảm bảo tin nhắn đến đích một cách đáng tin cậy.
- So sánh với WhatsApp: Để xử lý dung lượng lưu lượng truy cập của tác nhân dự kiến, hạ tầng của BAND được xây dựng trên cùng стек công nghệ được sử dụng bởi các gã khổng lồ nhắn tin toàn cầu như WhatsApp và Discord. Điều này đảm bảo nền tảng có thể mở rộng lên hàng tỷ tin nhắn khi danh tính kỹ thuật số bắt đầu nhiều hơn con người.
Nếu lưới là các "đường ống", thì Mặt phẳng kiểm soát (Control Plane) chính là "van". Lớp này cung cấp quản lý thời gian chạy mà các doanh nghiệp yêu cầu trước khi họ có thể mở rộng quy mô các hệ thống tự chủ một cách an toàn.
- Ranh giới thẩm quyền: Nền tảng cho phép các tổ chức thực thi các quy tắc nghiêm ngặt về việc tác nhân nào có thể nói chuyện với tác nhân nào và các chủ đề nào chúng có thể thảo luận.
- Chuyển tiếp thông tin xác thực: Một trong những rào cản lớn nhất trong hệ thống đa tác nhân là danh tính. BAND quản lý cách quyền hạn của con người và mã thông báo bảo mật di chuyển từ tác nhân này sang tác nhân khác. Ví dụ, nếu một con người yêu cầu Tác nhân A thông tin, và Tác nhân A ủy quyền nhiệm vụ đó cho Tác nhân B, BAND đảm bảo Tác nhân B chỉ truy cập dữ liệu mà con người ban đầu được phép xem.
Sản phẩm, nền tảng và bảng giá: Mở rộng lực lượng lao động đa tác nhân, đa mô hình
Bộ sản phẩm của BAND được thiết kế để "không phụ thuộc vào khung" (framework-agnostic) và "không phụ thuộc vào đám mây" (cloud-agnostic), định vị mình là một phần mềm trung gian độc lập giúp tránh sự phụ thuộc vào nhà cung cấp (vendor lock-in). Trong một thị trường mà các siêu nhà cung cấp như OpenAI hoặc Anthropic muốn doanh nghiệp ở lại trong hệ sinh thái cụ thể của họ, BAND cung cấp sự linh hoạt để sử dụng mô hình tốt nhất trên nhiều lựa chọn khác nhau, bao gồm cả các tùy chọn nguồn mở và tùy chỉnh doanh nghiệp.
"Bất kể các tác nhân chạy ở đâu hoặc được xây dựng như thế nào, chúng tôi có thể gắn kết chúng lại với nhau, cho phép chúng tìm thấy nhau, ủy quyền nhiệm vụ và có giao tiếp hai chiều, song công," Goomanovsky nói. Ông lưu ý rằng mặc dù có các tùy chọn bên thứ nhất cạnh tranh từ các nhà cung cấp mô hình như các tác nhân không gian làm việc của OpenAI (công bố hôm qua) và Các tác nhân được quản lý của Anthropic Claude (công bố đầu tháng này), BAND "đóng vai trò là nền tảng độc lập cho phép một doanh nghiệp tránh bị khóa vào nhà cung cấp."
Hiện tại, công ty đang thấy mức độ chấp nhận tốt nhất trong các lĩnh vực "hướng về công nghệ", bao gồm viễn thông, dịch vụ tài chính và an ninh mạng.
- Tác nhân viết mã (Coding Agents): Đây hiện nay là trường hợp sử dụng phổ biến nhất. Các nhà phát triển thường thấy rằng Claude vượt trội hơn về lập kế hoạch, trong khi Codex tốt hơn trong việc xem xét mã. BAND cho phép các tác nhân này hoạt động đồng thời, ủy quyền nhiệm vụ cho nhau trong thời gian thực.
- Hỗ trợ khách hàng và Vận hành: Ngoài viết mã, BAND cho phép tự động hóa "vượt ranh giới". Ví dụ, một nhân viên mới có thể được onboarding bởi một tác nhân Workday, tác nhân này sau đó giao tiếp với một tác nhân ServiceNow để mở vé trang thiết bị, và cuối cùng nói chuyện với một tác nhân mua hàng để chốt đơn.
Để hiểu được tính nhạy cảm của dữ liệu doanh nghiệp, BAND cung cấp ba cách chính để sử dụng nền tảng:
- SaaS: Nền tảng dựa trên đám mây trực tiếp nơi các tác nhân kết nối qua API.
- Đám mây riêng/Tại chỗ (Private Cloud/On-Premise): Toàn bộ nền tảng có thể được triển khai trong VPC của khách hàng hoặc môi trường tại chỗ để đảm bảo dữ liệu không bao giờ rời khỏi sự kiểm soát của họ.
- Biên mạng (The Edge): Hạ tầng đủ nhẹ để có thể triển khai trên "vật thể bay" như máy bay không người lái (UAV) hoặc thậm chí vệ tinh, tạo điều kiện giao tiếp giữa các tác nhân trong các môi trường bị cô lập về mặt vật lý.
Cấp phép, quản trị và định giá
BAND hoạt động như một thương mại, tập trung vào việc cung cấp sự ổn định và bảo mật "đẳng cấp doanh nghiệp". Mặc dù nền tảng tích hợp với các khung nguồn mở như LangChain và CrewAI, công nghệ định tuyến và kiểm soát lõi của riêng họ là độc quyền và đang chờ cấp bằng sáng chế.
Đối với các nhà lãnh đạo CNTT doanh nghiệp, "Mặt phẳng kiểm soát" ít liên quan đến giao tiếp hơn là tính năng kiểm toán. BAND cung cấp khả năng quan sát đầy đủ vào mọi tương tác của tác nhân, tạo thành một bản ghi và "dấu vết giấy tờ" cho các hành động tự chủ. Đây là một giải pháp "bổ sung" cho các sản phẩm bảo vệ hiện có; trong khi một hàng rào bảo vệ có thể bảo vệ một tác nhân đơn lẻ khỏi việc tiêm lệnh (prompt injection), BAND bảo vệ toàn bộ hệ thống khỏi các sự cố lan truyền (cascading failures) do một tác nhân thông tin sai cho tác nhân khác gây ra.
Công ty đã ra mắt với mô hình định giá phân tầng được thiết kế để phục vụ mọi người từ những "người yêu thích tác nhân" cá nhân đến các tập đoàn toàn cầu:
- Miễn phí ($0/tháng): Dành cho cá nhân. Cho phép tối đa 10 tác nhân từ xa và 50 phòng trò chuyện hoạt động, mặc dù dữ liệu chỉ được lưu giữ trong 24 giờ.
- Pro ($17.99/tháng): Nhắm đến các startup và nhóm R&D đang phát triển. Cấp độ này tăng giới hạn lên 40 tác nhân và 250 phòng trò chuyện hoạt động với hỗ trợ qua email.
- Doanh nghiệp (Tùy chỉnh): Cung cấp số lượng tác nhân không giới hạn, chính sách lưu giữ dữ liệu tùy chỉnh để đáp ứng các yêu cầu tuân thủ và quyền truy cập API đầy đủ vào "Memory APIs" của BAND.
Hướng tới "Người điều phối toàn cầu"
Sự xuất hiện của BAND trùng hợp với sự thay đổi trong cách các nhà phân tích nhìn nhận thị trường AI. Gartner đã dự đoán rằng đến năm 2029, 90% doanh nghiệp triển khai nhiều tác nhân sẽ cần những gì họ gọi là "Người điều phối toàn cầu" (Universal Orchestrator). Tương tự, Forrester đã công nhận "Mặt phẳng kiểm soát tác nhân" là một danh mục thị trường mới nổi và riêng biệt.
Công ty được thành lập bởi Goomanovsky và Vlad Luzin, người đã kết hợp nền tảng của họ trong tình báo Israel, an ninh mạng và hệ thống đa tác nhân để xây dựng BAND.
Goomanovsky nhìn nhận nền tảng không chỉ là một công cụ, mà là một lớp nền tảng cho kỷ nguyên tiếp theo của internet.
"Giao tiếp là vấn đề cơ bản nhất trong điện toán," Goomanovsky lưu ý. "Khi những sinh vật mới xuất hiện, điều đầu tiên chúng cần là một cách để nói chuyện với nhau... Chúng tôi là internet của các tác nhân".
Vòng hạt giống 17 triệu USD được dẫn đầu bởi Sierra Ventures, Hetz Ventures và Team8. Tim Guleri của Sierra Ventures nhấn mạnh rằng BAND đang xây dựng "lớp còn thiếu" làm cho sự cộng tác quy mô lớn trở nên thực tế.
Khoản vốn này sẽ được sử dụng để mở rộng nhóm kỹ thuật và tăng tốc phát triển hệ sinh thái "đối tác thiết kế", hiện đã bao gồm các công ty viễn thông hàng đầu Bắc Mỹ và các công ty thanh toán kỹ thuật số Châu Âu.
Khi các tác nhân chuyển đổi từ những mới lạ kỹ thuật số trở thành động lực chính của quy trình làm việc doanh nghiệp, "mã keo" kết nối chúng sẽ trở thành mảnh quan trọng nhất của ngăn xếp. Sự ra mắt của BAND đánh dấu nỗ lực nghiêm túc đầu tiên để chuẩn hóa lớp keo đó, biến một "ban nhạc" hỗn loạn của các tác nhân thành một bản giao hưởng đồng bộ và được quản lý.



