SageOx: Giải pháp hạ tầng ngữ cảnh giúp AI Agent không bị "lạc trôi" trong các cuộc thảo luận của nhóm

SageOx, startup do các cựu kỹ sư xây dựng AWS EC2 sáng lập, đã công bố giải pháp "hạ tầng ngữ cảnh cho tác nhân AI" nhằm giúp các AI Agent nắm bắt đầy đủ thông tin từ cuộc họp và tài liệu nội bộ. Công ty vừa huy động thành công 15 triệu USD vòng hạt giống để phát triển hệ thống phần cứng và phần mềm này, giúp AI hiểu rõ "tại sao" và "như thế nào" một nhiệm vụ cần được thực hiện.

Khi các nhà cung cấp mô hình AI ngày càng mở rộng xuống hạ nguồn, tung ra các sản phẩm và tác nhân AI cho các ứng dụng doanh nghiệp cụ thể, một câu hỏi lớn vẫn còn bỏ ngỏ: Làm thế nào để trang bị cho các tác nhân AI đó ngữ cảnh (context) phù hợp xung quanh một nhiệm vụ — ai là người giao việc, các bên liên quan khác là ai, đã có những dữ liệu hay thảo luận nào về nó và nó nên được thực hiện như thế nào?

Việc thực hành "kỹ thuật ngữ cảnh" vẫn là một trong những vấn đề lớn chưa được giải quyết của kỷ nguyên AI. Tuy nhiên, SageOx, một startup tại Seattle được thành lập bởi những cựu binh đã xây dựng hạ tầng AWS EC2 và EBS ban đầu, tin rằng họ có câu trả lời: một lớp hệ thống mới được gọi là "hạ tầng ngữ cảnh cho tác nhân AI" (agentic context infrastructure).

Bằng cách kết hợp giữa các thiết bị ghi âm phần cứng nhỏ và các ứng dụng mà doanh nghiệp đang sử dụng — như Slack, email, tài liệu, tệp tin — và áp dụng các khung mã nguồn mở cùng hướng dẫn mới lên tất cả, SageOX đã phát triển một hệ thống giúp doanh nghiệp giữ cho các tác nhân AI luôn "trong vòng lặp thông tin" và được cập nhật về các nhiệm vụ giống như nhân viên con người, ngăn chúng "lạc trôi" khỏi các nhiệm vụ được giao và mục tiêu lớn hơn của công ty.

"Chúng tôi đang nắm bắt tất cả ngữ cảnh này tại nơi nó diễn ra," Ajit Banerjee, nhà sáng lập và CEO của SageOX, cựu kỹ sư tại Hugging Face, Meta, Amazon và Apple, cho biết trong một cuộc phỏng vấn video với VentureBeat. "Phát triển sản phẩm là môn thể thao đồng đội, và ngữ cảnh không chỉ đến từ việc mọi người gõ phím. Nó diễn ra trong các cuộc trò chuyện."

Bằng cách nắm bắt "tại sao" đằng sau "cái gì" — ý định sống trong các luồng thảo luận trên Slack, các buổi vẽ bảng trắng và những cuộc trò chuyện ngoài giờ — SageOx nhằm mục đích cung cấp một "tâm trí tập thể" (hivemind) đảm bảo các tác nhân không bị lạc hướng và con người vẫn giữ được sự tập trung.

"Cách mọi người phải làm việc không phải là sự phối hợp kiểu cũ, nơi tôi viết ra một vấn đề và sau đó nó đi qua một chuỗi quy trình. Nó phải gần giống như chơi nhạc Jazz," Banerjee thêm.

Hôm nay, công ty đã bước ra khỏi chế độ ẩn danh (stealth) để công bố vòng hạt giống trị giá 15 triệu USD do Canaan dẫn đầu, với sự tham gia của A.Capital, Pioneer Square Labs và Founders’ Co-op.

Kiến trúc bộ nhớ của nhóm

Các tác nhân AI ngày nay hoạt động trong các phiên làm việc cô lập, thiếu bộ nhớ chia sẻ về các quyết định trước đó hoặc ý định kiến trúc.

Mỗi nhiệm vụ thực chất đều bắt đầu từ con số không, buộc các nhà phát triển phải tóm tắt lại ngữ cảnh thủ công — một quá trình làm suy yếu tốc độ mà các tác nhân được mang lại. SageOx giải quyết vấn đề này thông qua một bộ sản phẩm đa nền tảng được thiết kế để nắm bắt ngữ cảnh ở bất cứ nơi nào nó tự nhiên diễn ra.

Tại trung tâm của hệ sinh thái này là Ox Dot. Một thiết bị phần cứng tùy chỉnh được thiết kế cho văn phòng chung, Dot giúp ghi lại các cuộc họp, buổi họp đứng (standups) và các bài đánh giá thiết kế chỉ với một lần chạm.

Tính năng đặc biệt nhất của nó là "Auto Rewind" — một giải pháp dự phòng cho những ý tưởng đột phát của nhóm. Nếu một bước đột phá xảy ra trong một cuộc trò chuyện chưa được ghi lại, Auto Rewind cho phép nhóm "tua lại" và nắm bắt cuộc thảo luận sau khi sự việc đã xảy ra. Âm thanh này được chuyển thành văn bản, xác định người nói và chắt lọc vào bộ nhớ của nhóm, nơi nó có thể được truy cập bởi cả con người và tác nhân.

Đối với nhà phát triển, Ox CLI mã nguồn mở, được cấp phép MIT, cung cấp cầu nối. Các lệnh như ox agent prime cho phép các trợ lý viết mã — bao gồm Claude Code và Codex — tham khảo lịch sử chia sẻ của nhóm trước khi viết mã. Điều này đảm bảo rằng nếu một nhóm quyết định trong một cuộc họp sử dụng một mẫu xác thực cụ thể, tác nhân sẽ biết điều đó mà không cần được chỉ dẫn rõ ràng trong một lệnh nhắc (prompt).

Tiến sĩ Rupak Majumdar, Giám đốc Khoa học tại Viện Hệ thống Phần mềm Max Planck, nhận xét sau khi thấy tốc độ phát triển của nhóm, họ đang thực sự "coi mã nguồn như ngôn ngữ hợp ngữ" (treating code like assembler).

Kỹ thuật tác nhân: Vượt qua tư duy mã nguồn "sạch"

Sự chuyển dịch sang quy trình làm việc ưu tiên tác nhân (agent-first) đã buộc đội ngũ SageOx phải xem xét lại gần như mọi nguyên tắc của quản lý phần mềm hiện đại.

CTO của SageOX, Ryan Snodgrass, cựu nhân viên Amazon, lưu ý trong một bài đăng trên blog rằng việc quản lý nhánh (branch management) và lịch sử commit "sạch" thường "không tốt cho các tác nhân". Trong thế giới cũ, con người thích các PR (Pull Request) lớn dễ đọc trong một lần xem xét mã.

Trong kỷ nguyên của tác nhân AI, các PR dài 10.000 dòng trải rộng trên cơ sở mã khiến tác nhân không thể suy luận về ý định.

Thay vào đó, SageOx ủng hộ các commit nhỏ hơn, khối lượng lớn và tập trung cao độ. Lịch sử "có thể đọc được bởi tác nhân" này cho phép máy nhìn lại và hiểu chính xác tại sao một thay đổi cụ thể được thực hiện. Đội ngũ thậm chí đang đánh giá lại cấu trúc kho lưu trữ (repo); trong khi họ hiện tại sử dụng một kho đơn (monorepo) cho 750.000 dòng mã của mình, họ đang khám phá một tương lai nơi các tác nhân quản lý một chòm sao các kho nhỏ (micro-repos), vì các tác nhân có thể "bị lạc" khi cơ sở mã phát triển quá lớn so với cửa sổ ngữ cảnh (context window) của chúng.

Triết lý "tốc độ hơn sự tĩnh tại" này đã cho phép đội ngũ xây dựng firmware riêng cho Ox Dot trong chưa đầy hai tuần, mặc dù không có kinh nghiệm phần cứng gần đây.

Bằng cách đưa các tài liệu PDF kỹ thuật và tài liệu hướng dẫn vào các mô hình AI, họ đã bỏ qua nhiều tháng nghiên cứu truyền thống. CEO Ajit Banerjee gọi đây là việc "bỏ học" các thói quen cũ — nhận ra rằng "gánh nặng nặng nhọc không khác biệt" (undifferentiated heavy lifting) của công việc tri thức giờ đây có thể được chuyển giao cho một hệ thống ghi nhớ mọi thứ nhóm biết.

Minh bạch tuyệt đối: Từ mã nguồn mở đến mô hình "Làm việc mở"

Có lẽ quan trọng không kém công nghệ là cam kết của SageOx đối với "Làm việc mở" (Open Work). Vượt qua phần mềm mã nguồn mở truyền thống, công ty đang thực hiện một hình thức minh bạch tuyệt đối trong nỗ lực thúc đẩy sự tăng tốc phát triển trên toàn cộng đồng mã nguồn mở và bất kỳ doanh nghiệp nào muốn học hỏi từ cách họ làm việc.

Đội ngũ SageOx công khai chia sẻ các lệnh nhắc nội bộ (internal prompts), các buổi lập kế hoạch và thậm chí cả các cuộc tranh luận nội bộ chưa qua lọc của họ với công chúng. Người dùng có thể đăng nhập vào bảng điều khiển SageOx và xem đội ngũ xây dựng SageOx theo thời gian thực.

Cách tiếp cận "mở bát hoàn toàn" này là một quyết định có chủ đích để dẫn đầu bằng ví dụ. Banerjee lập luận rằng vì họ yêu cầu các nhóm thay đổi cách làm việc, họ phải sẵn sàng cho thấy những khoảnh khắc "WTF" và các điều chỉnh hướng đi khi chúng xảy ra.

"Cách mạng không được phát sóng trên truyền hình," Banerjee nói. "Nó sẽ được SageOx hóa."

Sự minh bạch này nhằm chứng minh rằng một nhóm nhỏ, tinh gọn — "gắn kết tinh gọn" — có thể vượt qua các tổ chức khổng lồ bằng cách tận dụng lớp ngữ cảnh chia sẻ.

Về kế hoạch kiếm tiền và có lãi, Banerjee cho biết con đường doanh thu được mô phỏng theo kịch bản của AWS EC2: bắt đầu với những người chấp nhận sớm, đặc biệt là các startup AI bản địa nhỏ, sau đó mở rộng sang các doanh nghiệp khi nhu cầu trở nên rõ ràng.

Nền tảng hạ tầng uy tín

Nền tảng kỹ thuật của SageOx bắt nguồn từ những ngày đầu của hạ tầng đám mây.

Banerjee là thành viên ban đầu của đội ngũ AWS EC2, và Snodgrass là một trong những kỹ sư đầu tiên của Amazon, người dẫn dắt sự chuyển đổi từ kiến trúc đơn khối sang vi dịch vụ (microservices).

Bối cảnh này được phản ánh trong tên gọi của công ty: "Ox" đại diện cho "công việc của người nông dân" (Yeoman work) mà họ nhằm thực hiện — một con vật đáng tin cậy xử lý việc nặng nhọc về dữ liệu và ngữ cảnh để nhóm có thể tiến lên phía trước.

Tầm nhìn của SageOx là một nơi mà con người không còn là người lắp ráp ngữ cảnh thủ công.

Thay vào đó, họ đóng vai trò là người điều khiển một động cơ "xử lý song song".

Trong một bản demo gần đây, một yêu cầu tính năng đã chuyển từ một cuộc thảo luận bằng lời nói đến việc triển khai hoàn thành trong chưa đầy bảy phút. Bằng cách kích hoạt các tác nhân viết mã với ngữ cảnh được ghi lại của cuộc thảo luận ban đầu, nhóm đã bỏ qua nhu cầu về các thông số kỹ thuật chính thức hoặc vé Jira.

Cách làm việc mới

Hiện tại, SageOx đang tập trung nỗ lực vào các startup "AI bản địa" — những nhóm hoạt động chủ yếu thông qua các lệnh nhắc và dựa nhiều vào đồng nghiệp là tác nhân AI.

Bộ công cụ của họ, từ Ox CLI mã nguồn mở đến Ox Dot có hỗ trợ phần cứng, được thiết kế để giải quyết vấn đề ngay lập tức của sự sai lệch liên kết (alignment drift).

Khi AI chuyển từ being a tool to being a teammate (từ công cụ thành đồng nghiệp), tài sản quý giá nhất mà một công ty sở hữu không còn là mã nguồn thô, mà là ngữ cảnh chia sẻ của họ.

SageOx gợi ý rằng con đường đi phía trước không phải là cất giấu thông tin đằng sau các "hàng rào tư nhân", mà là tạo ra một mặt đất chung nơi ý định hiển thị với mọi đồng đội — dù là người hay máy. Trong kỷ nguyên mới này, những đội ngũ chiến thắng sẽ là những đội ngũ có thể ghi nhớ nhanh chóng như cách họ thực thi.