LinkedIn giới thiệu Cognitive Memory Agent: Kiến tạo bộ nhớ dài hạn cho các tác nhân AI

LinkedIn đã công bố Cognitive Memory Agent (CMA), một lớp hạ tầng AI tạo sinh giúp các hệ thống duy trì trạng thái và nhận thức ngữ cảnh. Hệ thống này giải quyết vấn đề "mất trí nhớ" của các mô hình ngôn ngữ lớn (LLM) thông qua ba lớp bộ nhớ: tập sự, ngữ nghĩa và quy trình, cho phép cá nhân hóa và phối hợp đa tác nhân hiệu quả hơn.

LinkedIn đã giới thiệu Cognitive Memory Agent (CMA) như một phần của ngăn xếp ứng dụng AI tạo sinh (generative AI) của mình. Mục tiêu của hệ thống này là tạo ra các tác nhân AI có trạng thái (stateful) và nhận thức ngữ cảnh, có khả năng lưu trữ cũng như tái sử dụng kiến thức qua các lần tương tác. CMA được thiết kế để hỗ trợ các ứng dụng như Hiring Assistant, giải quyết hạn chế cơ bản của các quy trình dựa trên mô hình ngôn ngữ lớn (LLM) hiện nay là tính phi trạng thái (statelessness) và sự mất tính liên tục giữa các phiên làm việc.

CMA hoạt động như một lớp hạ tầng bộ nhớ dùng chung nằm giữa các tác nhân ứng dụng và các mô hình ngôn ngữ bên dưới. Thay vì phải tái tạo ngữ cảnh thông qua việc nhắc đi nhắc lại (prompting) liên tục, các tác nhân giờ đây có thể lưu trữ, truy xuất và cập nhật bộ nhớ thông qua một hệ thống chuyên biệt. Điều này cho phép duy trì tính liên tục giữa các phiên, giảm thiểu suy luận thừa và cải thiện khả năng cá nhân hóa trong môi trường sản xuất, nơi ngữ cảnh của người dùng liên tục thay đổi.

Kiến trúc ba lớp bộ nhớ

Kiến trúc của CMA tổ chức bộ nhớ thành ba lớp riêng biệt để tối ưu hóa khả năng xử lý thông tin:

Lớp bộ nhớ trong kiến trúc Cognitive Memory Agent

Bộ nhớ tập sự (Episodic memory): Ghi lại lịch sử tương tác và các sự kiện hội thoại, cho phép tác nhân nhớ lại các cuộc trao đổi trong quá khứ.
Bộ nhớ ngữ nghĩa (Semantic memory): Lưu trữ kiến thức có cấu trúc được rút ra từ các tương tác, cho phép suy luận dựa trên các sự kiện bền vững về người dùng, thực thể hoặc sở thích.
Bộ nhớ quy trình (Procedural memory): Mã hóa các quy trình công việc đã học và các mẫu hành vi, giúp tác nhân cải thiện chiến lược thực thi nhiệm vụ theo thời gian.

Sự kết hợp giữa các lớp này giúp chuyển đổi hành vi của tác nhân từ việc phản hồi đơn lẻ sang khả năng thích ứng dài hạn.

Tối ưu hóa cho hệ thống đa tác nhân

CMA đóng vai trò quan trọng trong các hệ thống đa tác nhân (multi-agent systems). Thay vì mỗi tác nhân duy trì một ngữ cảnh cô lập, CMA cung cấp một nền tảng bộ nhớ dùng chung có thể truy cập được trên các tác nhân chuyên trách chịu trách nhiệm lập kế hoạch, suy luận và thực thi. Lớp dùng chung này giúp giảm thiểu sự trùng lặp trạng thái, cải thiện sự phối hợp và đảm bảo tính nhất quán trong đầu ra trên các quy trình làm việc phân tán.

Xiaofeng Wang, một kỹ sư tại LinkedIn, nhận định về tầm quan trọng của bộ nhớ:

"Bộ nhớ là một trong những phần thách thức nhất và có tác động lớn nhất khi xây dựng các tác nhân sản xuất, vì nó cho phép cá nhân hóa thực sự, tính liên tục và khả năng thích ứng ở quy mô lớn."

Thách thức kỹ thuật và quản lý vòng đời

Về mặt hệ thống, CMA tích hợp nhiều cơ chế truy xuất và quản lý vòng đời. Truy xuất ngữ cảnh gần đây hỗ trợ sự phù hợp ngắn hạn, trong khi tìm kiếm ngữ nghĩa cho phép truy cập lịch sử tương tác dài hạn. Nén bộ nhớ thông qua tóm tắt giúp kiểm soát sự tăng trưởng lưu trữ và duy trì hiệu suất ở quy mô lớn.

Tuy nhiên, các hệ thống bộ nhớ bền vững cũng đặt ra những thách thức kinh điển trong hệ thống phân tán. Việc xác định những gì cần lưu trữ, khi nào truy xuất và cách xử lý dữ liệu lỗi thời là trung tâm của tính đúng đắn của hệ thống.

Karthik Ramgopal, Kỹ sư Xuất sắc của LinkedIn, nhấn mạnh sự chuyển dịch sang ngữ cảnh bền vững:

"Tác nhân AI tốt không phải là phi trạng thái: Nó nhớ, thích ứng và tích lũy. Một trong những khả năng chính cho phép điều này là bộ nhớ sống vượt ra ngoài các cửa sổ ngữ cảnh."

Subhojit Banerjee, Kỹ sư Dữ liệu MLOps, cũng chỉ ra những khó khăn trong việc quản lý trạng thái:

"Việc vô hiệu hóa bộ nhớ đệm (cache invalidation) là một trong những vấn đề khó nhất trong khoa học máy tính. Thách thức rõ ràng trong việc trích xuất bộ nhớ này là xác định chính xác ranh giới của các tập sự, tính lỗi thời và giải quyết xung đột."

Hướng tới tương lai của AI sản xuất

Trong các ứng dụng hướng tới người dùng như tuyển dụng, LinkedIn cũng kết hợp xác thực của con người vào quy trình làm việc. Cách tiếp cận lai này giúp đảm bảo rằng các đầu ra được tạo bởi AI, được tăng cường bởi bộ nhớ bền vững, vẫn phù hợp với ý định của người dùng và yêu cầu kinh doanh, đặc biệt là trong các môi trường ra quyết định quan trọng.

CMA phản ánh sự chuyển dịch kiến trúc rộng lớn hơn trong các hệ thống AI từ việc tạo sinh phi trạng thái sang thiết kế tác nhân dựa trên bộ nhớ và có trạng thái. Bằng cách bên ngoài hóa bộ nhớ thành một lớp hạ tầng chuyên biệt, LinkedIn định vị CMA là một nền tảng ngang để xây dựng các hệ thống tác nhân thích ứng, cá nhân hóa và cộng tác ở quy mô lớn.