MemPalace: Hệ Thống Bộ Nhớ Dài Hạn Chỉ Với 170 Tokens Cho AI Agent

07 tháng 4, 2026·6 phút đọc

MemPalace giới thiệu một phương pháp lưu trữ trí nhớ AI theo cấu trúc lấy cảm hứng từ kỹ thuật nhớ của người Hy Lạp cổ đại. Với cách tiếp cận nén thông minh AAAK, tải nhớ theo lớp và đồ thị tri thức thời gian, MemPalace cho phép AI khởi động nhanh, tra cứu chính xác và tiết kiệm chi phí.

MemPalace: Hệ Thống Bộ Nhớ Dài Hạn Chỉ Với 170 Tokens Cho AI Agent

MemPalace: Hệ Thống Bộ Nhớ Dài Hạn Chỉ Với 170 Tokens Cho AI Agent

MemPalace là một hệ thống bộ nhớ dài hạn dành cho các AI agent, giúp ghi nhớ thông tin từ các cuộc hội thoại và dự án trong nhiều tháng, mà không cần tải toàn bộ lịch sử làm việc với số token lớn. Thay vì lưu giữ mọi thứ trong một file bối cảnh khổng lồ, MemPalace tổ chức trí nhớ thành một “kho” có cấu trúc, nén hiệu quả và tải dữ liệu theo từng lớp khi cần, giảm thiểu chi phí và tăng độ chính xác tìm kiếm lên đến 96,6%.

Kiến trúc bộ nhớ hình cung điện (Memory Palace)

MemPalace lấy cảm hứng từ kỹ thuật nhớ nổi tiếng của người Hy Lạp cổ đại, phân chia bộ nhớ thành nhiều cấp độ tổ chức tương tự như một cung điện gồm:

  • Wing (cánh): đại diện cho các dự án, người hoặc chủ đề lớn.
  • Room (phòng): các chủ đề con trong 1 cánh — vd: xác thực, thanh toán, triển khai.
  • Hall (hành lang): các loại bộ nhớ chung cho tất cả cánh như quyết định cố định, sự kiện, phát hiện, thói quen, lời khuyên.
  • Closet (tủ chứa): các bản tóm tắt nén chứa liên kết tới nội dung gốc.
  • Drawer (ngăn kéo): lưu giữ các file gốc không mất dữ liệu.
  • Tunnel (đường hầm): liên kết giữa các cánh khi có phòng trùng lặp.

Cấu trúc này mang lại cải thiện rõ rệt về độ chính xác tìm kiếm, tăng đến 34% so với khi tìm kiếm không phân loại.

Phạm vi tìm kiếmR@10Cải thiện
Tất cả các tủ60.9%
Trong cánh73.1%+12%
Cánh + hành lang84.8%+24%
Cánh + phòng94.8%+34%

Định dạng nén AAAK độc đáo

Điểm đặc biệt nhất của MemPalace là định dạng nén AAAK — một dạng viết tắt đơn giản, đọc được dễ dàng bởi mọi mô hình ngôn ngữ (Claude, GPT, Llama, Mistral…), đạt tỷ lệ nén khoảng 30 lần.

Ví dụ bản gốc (~1000 tokens):

Priya manages Driftwood team: Kai (backend, 3 years), Soren (frontend),
Maya (infrastructure), Leo (junior, started last month). Building SaaS
analytics platform. Current sprint: auth migration to Clerk. Kai
recommended Clerk over Auth0 based on pricing and DX.

Bản nén AAAK (~120 tokens):

TEAM: PRI(lead) | KAI(backend,3yr) SOR(frontend) MAY(infra) LEO(junior,new)
PROJ: DRIFTWOOD(saas.analytics) | SPRINT: auth.migration→clerk
DECISION: KAI.rec:clerk>auth0(pricing+dx) | ★★★★

Chính nhờ tính đơn giản, mọi LLM đều có thể “đọc” trực tiếp mà không cần giả mã phức tạp.

Tải bộ nhớ theo lớp (Layered Memory Loading)

MemPalace chia bộ nhớ thành 4 lớp, chỉ tải dần khi cần thiết, giúp khởi động nhanh và tiết kiệm token:

LớpNội dungKích thướcKhi tải
L0Danh tính AI~50 tokensLuôn luôn
L1Thông tin quan trọng (team, proj)~120 tokensLuôn luôn
L2Nhớ lại phòng (phiên gần đây)Theo yêu cầuKhi chủ đề xuất hiện
L3Tìm kiếm sâu (semantic toàn bộ)Theo yêu cầuKhi được yêu cầu

So sánh chi phí và token tải:

Cách tiếp cậnToken tảiChi phí/năm
Paste tất cả19.5 triệuKhông khả thi
Tổng hợp LLM~650K~$507
MemPalace wake-up~170~$0.70
MemPalace + 5 tìm kiếm~13,500~$10

Đồ thị tri thức theo thời gian (Temporal Knowledge Graph)

MemPalace lưu trữ tri thức trên SQLite với khả năng lưu ngày hiệu lực (valid_from) và ngày kết thúc (invalidate). Điều này khắc phục vấn đề thông tin cũ lỗi thời, thường xảy ra với file CLAUDE.md, bằng cách đánh dấu ngày kết thúc mà không xóa hẳn dữ liệu.

Ví dụ:

  • Kai làm việc trên dự án Orion từ 2025-06-01 đến 2026-03-01.
  • Maya được giao task "auth-migration" từ 2026-01-15 và vẫn còn hiệu lực ngày 2026-01-20.

Đồ thị tri thức còn phát hiện các mâu thuẫn như ai đó được giao sai nhiệm vụ hoặc thời gian sprint không hợp lệ.

Tích hợp với Claude Code

MemPalace cung cấp dịch vụ MCP server, tự động phát hiện 19 công cụ hỗ trợ tìm kiếm, lưu trữ, truy vấn đồ thị tri thức, nhật ký agent. Bạn còn có thể cài đặt các hook tự động lưu thông tin sau mỗi 15 tin nhắn hoặc trước khi nén lại bộ nhớ, giúp AI nhớ tự động mà không cần chỉ dẫn.

Ví dụ lệnh bổ sung MCP server:

claude mcp add mempalace -- python -m mempalace.mcp_server

Agent chuyên biệt (Specialist Agents)

MemPalace cho phép tạo nhiều agent chuyên biệt với bộ nhớ riêng, tập trung vào từng lĩnh vực như:

  • reviewer.json: mẫu đánh giá code, lỗi bug
  • architect.json: quyết định thiết kế, lựa chọn trade-off
  • ops.json: deploy, sự cố, hạ tầng

Mỗi agent có nhật ký AAAK riêng để tích lũy kinh nghiệm và theo dõi lịch sử.

Cài đặt và sử dụng

Cài đặt đơn giản qua pip:

pip install mempalace
mempalace init ~/projects/myapp
mempalace mine ~/projects/myapp          # Mỏ dữ liệu từ code dự án
mempalace mine ~/chats/ --mode convos    # Mỏ dữ liệu lịch sử hội thoại
mempalace search "why did we switch to GraphQL"
mempalace wake-up > context.txt          # Tạo bối cảnh khởi động

MemPalace hỗ trợ nhập dữ liệu từ các cuộc trò chuyện Claude, ChatGPT và Slack, đồng thời chia nhỏ file lớn để quản lý hiệu quả.

So sánh với CLAUDE.md

Trước đây nhiều người chỉ dùng CLAUDE.md để ghi nhớ với file text phẳng không có khả năng hiểu thời gian, phải tải nguyên tệp mỗi lần khởi động gây tốn tài nguyên.

MemPalace lại xây dựng căn cứ bộ nhớ theo cấu trúc và tải thông minh, phù hợp cho quản lý trí nhớ dài hạn, đa dự án, liên tục cập nhật và có thể truy vấn sâu.

Tuy nhiên MemPalace cũng yêu cầu thiết lập Python, SCP server, cấu hình hook phức tạp hơn. Nếu bạn chỉ cần lưu vài quy tắc nhỏ thì CLAUDE.md vẫn dễ dùng. Nhưng với quy mô lớn và nhiều phiên liên tục, MemPalace cho thấy giá trị vượt trội.

Tham khảo


MemPalace mở ra một hướng tiếp cận mới cho trí nhớ AI, giúp các agent duy trì kiến thức dài hạn hiệu quả, giảm chi phí và nâng cao trải nghiệm phát triển phần mềm hoặc quản lý dự án có sự tham gia của AI một cách chủ động hơn.

Bài viết được tổng hợp và biên soạn bằng AI từ các nguồn tin tức công nghệ. Nội dung mang tính tham khảo. Xem bài gốc ↗