Tại sao các tác nhân AI doanh nghiệp cần một "bộ nhớ chung" để thực sự hiệu quả

Mặc dù 75% nhân viên tri thức sử dụng AI, chỉ có 5% doanh nghiệp báo cáo sự gia tăng năng suất, phần lớn do thiếu khả năng chia sẻ ngữ cảnh giữa các tác nhân. Vấn đề cốt lõi nằm ở việc các công cụ AI hiện tại thường học hỏi theo cá nhân thay vì xây dựng một bộ nhớ chung cho cả đội ngũ, dẫn đến sự lãng phí và thiếu nhất quán trong quy trình làm việc.

Khi một thành viên trong đội hình sửa lỗi cho một tác nhân AI — thông qua lời nhắc (prompt) tốt hơn, phản hồi chính xác hơn hoặc ngữ cảnh rõ ràng hơn — sự cải thiện đó sẽ biến mất ngay khi đồng nghiệp mở cùng một công cụ. Sự điều chỉnh không được chuyển giao, và người tiếp theo phải bắt đầu lại từ con số không.

Vấn đề này trở nên phức tạp hơn trong các quy trình làm việc đa tác nhân (multi-agent workflows), nơi các đội ngũ mong muốn các tác nhân chia sẻ ngữ cảnh giữa người dùng và nhiệm vụ. Nếu không có một lớp bộ nhớ chia sẻ (shared memory layer), mỗi thành viên trong đội hình thực chất đang huấn luyện một phiên bản khác nhau của cùng một tác nhân — và các phiên bản này không bao giờ đồng bộ hóa.

Khoảng cách này thể hiện rõ qua các con số. Theo nghiên cứu của Asana, 75% nhân viên tri thức sử dụng AI trong công việc, nhưng chỉ có 5% công ty báo cáo sự gia tăng năng suất.

"Các nhà cung cấp mô hình đang trở nên rất giỏi trong việc cải thiện khả năng lập luận và các vòng lặp thử lại (retry loops), nhưng điều họ không giỏi là đưa ngữ cảnh công việc doanh nghiệp vào theo cách mà con người có thể lập luận về nó cho bộ nhớ chia sẻ," Arnab Bose, Giám đốc Sản phẩm của Asana, chia sẻ với VentureBeat.

Asana đã đang xây dựng hướng tới một nền tảng tập trung vào ngữ cảnh và bộ nhớ chia sẻ. Nền tảng Quản lý công việc dựa trên tác nhân (Agentic Work Management) của họ đảm bảo rằng nếu bất kỳ thành viên nào trong đội hình sửa lỗi một tác nhân, sự điều chỉnh đó sẽ được áp dụng cho tất cả những người còn lại.

"Đồ thị ngữ cảnh đó được tự động cung cấp cho các tác nhân hoạt động bên trong hệ thống của Asana, vì vậy bạn không cần phải biến mọi thành viên con người trong đội ngũ trở thành chuyên gia về kỹ thuật prompt hay kỹ thuật ngữ cảnh," Bose nói.

Bose cho biết kiến trúc bộ nhớ chia sẻ có tầm quan trọng vượt ra ngoài sản phẩm của riêng Asana; đó là quyết định thiết kế mà các doanh nghiệp cần thực hiện cho bất kỳ hệ thống đa tác nhân nào.

Bộ nhớ chia sẻ cũng trở nên quan trọng khi các doanh nghiệp bắt đầu chuyển đổi từ các tác nhân đơn lẻ đơn giản sang các quy trình làm việc đa tác nhân cần chia sẻ ngữ cảnh và hành vi.

Bộ nhớ cho quy trình đa tác nhân, đa nền tảng

Các mô hình điều khiển các tác nhân được thiết kế để không trạng thái (stateless) theo mặc định, do đó bộ nhớ trở thành một lớp chuyên biệt nằm ngoài cửa sổ ngữ cảnh (context window). Mặc dù lĩnh vực đổi mới AI này đang tiến tới sự trưởng thành, câu hỏi về những gì được lưu trữ, ai kiểm soát nó, và cách nó duy trì tính nhất quán khi các tác nhân và người dùng khác nhau ghi vào cùng một phiên bản vẫn phần lớn chưa được giải quyết.

Điều này có thể quản lý được đối với các trường hợp sử dụng chỉ có một người dùng. Tuy nhiên, trong các quy trình tác nhân doanh nghiệp, ý tưởng là để các tác nhân làm việc với toàn bộ đội ngũ. Hầu hết các nền tảng hiện nay có các tác nhân vẫn hoạt động cho các cá nhân, dẫn đến việc lặp lại nhiệm vụ, các phiên bản thực tế không nhất quán và sự lan truyền sai sót. Các tác nhân thậm chí có thể mâu thuẫn với nhau.

Sriharsha Chintalapani, đồng sáng lập và CTO của Collate, cho biết trong một email gửi tới VentureBeat rằng thiếu hụt bộ nhớ chia sẻ là một trở ngại lớn đối với các quy trình đa tác nhân, đặc biệt là về tính nhất quán.

"Các tác nhân rất nhạy cảm với chất lượng của prompt," Chintalapani nói. "Người có hiểu biết tốt về nhiệm vụ thường sẽ nhận được kết quả chính xác hơn người ít kinh nghiệm. Một phần là vì họ có thể xây dựng các prompt chi tiết hơn, nhưng cũng vì họ có thể đưa ra phản hồi tốt hơn cho tác nhân. Tác nhân ghi nhớ các chỉnh sửa nó đã nhận được và áp dụng kiến thức đó cho các prompt tiếp theo. Phản hồi càng chính xác, tác nhân sẽ hoạt động càng tốt cho người dùng đó."

Ông bổ sung rằng các tổ chức nên ngừng coi bộ nhớ chia sẻ là một vấn đề kỹ thuật prompt (prompt engineering) mà nên nghĩ đến việc xây dựng các hệ thống lặp lại ngữ cảnh trên mọi cuộc trò chuyện.

Neej Gore, giám đốc dữ liệu tại Zeta Global, cho biết trong một email riêng rằng ngữ cảnh chia sẻ trở thành một bộ nhớ sống "tích lũy trí tuệ trên toàn doanh nghiệp".

Cơ hội có thể nằm ở việc xây dựng các tác nhân AI truy xuất bộ nhớ theo quan hệ, kéo theo ngữ cảnh liên quan dựa trên những gì đang được hỏi — một cách tiếp cận mà Chintalapani cho biết ít tổ chức ngoài các nhà cung cấp mô hình lớn nhất có khả năng xây dựng.

Tác nhân cá nhân so với tác nhân nhóm

Các tác nhân AI đã phổ biến trong các doanh nghiệp; chỉ là nhiều trong số này hoạt động như các tác nhân cá nhân thực hiện công việc cụ thể cho từng người dùng. Hầu hết các prompt bắt đầu từ một người, mọi tệp được tải lên bởi một tài khoản, và ngay cả các tác nhân sống trong hệ thống toàn công ty cũng chủ yếu học hỏi các sở thích của người dùng cá nhân.

Hầu hết các nền tảng quy trình làm việc AI doanh nghiệp đều nhận ra bộ nhớ là quan trọng nhưng tiếp cận nó dưới các góc độ khác nhau. Ví dụ, Microsoft Copilot tiếp cận theo hướng ưu tiên cá nhân bằng cách học vai trò của người dùng trong tổ chức, sở thích về tông giọng và mô hình làm việc, sau đó được lưu trữ dưới dạng bộ nhớ cá nhân để tác nhân áp dụng trên các bề mặt Microsoft 365 khác nhau.

Đối với các đội ngũ kỹ thuật và điều phối đang đánh giá các nền tảng tác nhân, câu hỏi về bộ nhớ chia sẻ hiện nay là một tiêu chí mua sắm — không chỉ là một tính năng kỹ thuật phụ. Một tác nhân chỉ học cho người sử dụng nó sẽ đòi hỏi sự bảo trì cá nhân liên tục. Một tác nhân được kết nối với lớp bộ nhớ toàn đội ngũ sẽ tự động xây dựng kiến thức tổ chức.

Tại sao các tác nhân AI doanh nghiệp cần một "bộ nhớ chung" để thực sự hiệu quả

Bộ nhớ cho quy trình đa tác nhân, đa nền tảng

Tác nhân cá nhân so với tác nhân nhóm

Bài viết liên quan