Universal Memory Protocol: Chuẩn hóa bộ nhớ chia sẻ cho các tác nhân AI
Universal Memory Protocol (UMP) được giới thiệu như một giải pháp để chuẩn hóa bộ nhớ cho các tác nhân AI, cho phép chia sẻ dữ liệu xuyên suốt giữa các phiên làm việc và nền tảng khác nhau. Giao thức này giải quyết vấn đề phân mảnh dữ liệu bằng cách tạo ra một định dạng di động, có chữ ký số và tương thích với nhiều loại kho lưu trữ.

Trong bối cảnh các tác nhân AI (AI agents) ngày càng trở nên tinh vi hơn, một thách thức lớn vẫn tồn tại: khả năng "ghi nhớ" và duy trì mạch suy nghĩ xuyên suốt giữa các phiên làm việc, các tác nhân khác nhau và các nhà cung cấp dịch vụ khác nhau. Để giải quyết vấn đề này, Universal Memory Protocol (UMP) đã được ra mắt như một lớp tương thích mới, đóng vai trò là định dạng chia sẻ bộ nhớ chung cho hệ sinh thái AI.
UMP Logo
UMP được mô tả là một giao thức bộ nhớ độc lập với phương thức vận chuyển (transport-neutral). Nếu như MCP (Model Context Protocol) đã chuẩn hóa cách các tác nhân gọi các công cụ và tài nguyên, và A2A (Agent2Agent) chuẩn hóa cách chúng giao tiếp với nhau, thì UMP hoàn thành bộ ba bằng cách chuẩn hóa cách các tác nhân "nhớ" thông tin.
Vấn đề về sự phân mảnh bộ nhớ
Hiện tại, dữ liệu bộ nhớ của người dùng và các tác nhân AI đang bị phân tán khắp nơi. Chúng nằm rải rác trong các tệp tin tác nhân, ghi chú dự án trên Claude hay Codex, các bản xuất từ Recall, thư mục Obsidian, hoặc các cơ sở dữ liệu như Postgres, Redis và SQLite.
Mỗi nền tảng hoặc hệ thống (harness) đều tự tạo ra giải pháp bộ nhớ riêng tư, không thể di chuyển (non-portable). Điều này dẫn đến việc khi chuyển đổi sang một tác nhân mới hoặc một công cụ mới, quá trình học hỏi và ghi nhớ phải bắt đầu lại từ đầu. UMP ra đời để khắc phục tình trạng này bằng cách thống nhất các nguồn dữ liệu rời rạc đó thành một hình dạng bộ nhớ di động duy nhất.
Cơ chế hoạt động của UMP
Về bản chất, UMP không phải là một giao thức vận chuyển mới, mà là một giao thức ở cấp độ ứng dụng chạy trên các phương thức vận chuyển hiện có. Nó cung cấp một bộ bản ghi nhỏ gọn, có thể di chuyển, được ký số và theo dõi thời gian (bi-temporal).
Giao thức định nghĩa sáu thao tác chính:
- Capabilities: Khả năng
- Recall: Truy xuất/Gọi lại
- Remember: Ghi nhớ
- Revise: Sửa đổi
- Forget: Quên
- Get: Lấy dữ liệu (kèm theo phản hồi/tùy chọn đăng ký)
Một bản ghi UMP được thiết kế để an toàn và minh bạch:
- Hai thời gian (Bi-temporal): Theo dõi cả thời gian giao dịch và thời gian hiệu lực. Khi một sự thật thay đổi, bản ghi cũ sẽ bị đóng và liên kết với bản ghi mới thay vì bị ghi đè.
- Sở hữu bởi người dùng & Ký số: Người vận hành (không phải nhà cung cấp mô hình) nắm giữ khóa. Các bản ghi được định địa chỉ nội dung và ký bằng DID (Decentralized Identifier).
- Chống tiêm (Injection-resistant): Quy định bắt buộc phải có quy trình xác minh, lọc và khôi phục khung dữ liệu. Bộ nhớ không bao giờ được nội suy chuỗi trực tiếp vào prompt.
Tính linh hoạt và triển khai
UMP được thiết kế để có thể triển khai trên bất kỳ kho lưu trữ (store) nào. Nó không phụ thuộc vào một loại cơ sở dữ liệu cụ thể mà cung cấp các lớp triển khai thực tế cho:
- Tệp tin: JsonFileStore ghi bộ nhớ vào tệp
.ump.jsondi động; MarkdownDirectoryStore ghi các bản ghi.ump.mdcó thể chỉnh sửa bằng tay cho các kho lưu trữ kiểu Obsidian. - SQL & Cache: Hỗ trợ Postgres, SQLite và Redis mà không cần gói trình điều khiển cơ sở dữ liệu gốc.
- Cơ sở dữ liệu Vector: Các trình bao bọc cho VectorStore, Qdrant, Pinecone và Weaviate giúp các công cụ tìm kiếm dựa trên embedding giữ nguyên chất lượng truy xuất.
Đối với các nhà phát triển, UMP cung cấp SDK TypeScript để xây dựng các ứng dụng hoặc runtime có nhận thức về bộ nhớ, cũng như hỗ trợ HTTP cho các client sử dụng Python, Go, Swift hoặc trình duyệt. Nó cũng có thể hoạt động ngay lập tức như một máy chủ MCP cho các công cụ như Claude Code hoặc Cursor.
Tương lai của khả năng tương tác AI
Với bốn cấp độ tuân thủ (conformance levels) khác nhau, UMP cho phép các nhóm áp dụng theo từng bước. Bạn có thể bắt đầu chỉ bằng việc xuất tệp .ump.json và sau đó kết nối runtime đầy đủ khi đã sẵn sàng.
Bằng cách tách biệt cấu trúc, nguồn gốc, quyền truy cập và sự tin cậy khỏi trí thông minh (trích xuất, xếp hạng, hợp nhất) – phần mà để cho các engine bên dưới xử lý – UMP mở ra cánh cửa cho một hệ sinh thái AI nơi các tác nhân không chỉ thông minh hơn mà còn có "ký ức" liên tục và đáng tin cậy hơn.
Bài viết liên quan

Phần mềm
GitLab cắt giảm 14% nhân sự để tái cấu trúc hạ tầng phục vụ AI
03 tháng 6, 2026

Công nghệ
Các tác nhân AI đã khiến thế giới công nghệ chao đảo: Câu chuyện đằng sau cuộc cách mạng Claude Code và OpenClaw
26 tháng 5, 2026

Công nghệ
CEO Palantir: 10% thế giới "ghét chúng tôi một cách chuyên nghiệp"
05 tháng 5, 2026
