YantrikDB: Động cơ bộ nhớ nhận thức cho AI, biết cách quên và tự phát hiện mâu thuẫn

YantrikDB là một cơ sở dữ liệu bộ nhớ mới dành cho các tác nhân AI, giải quyết vấn đề "nhiễu" của các vector database hiện tại bằng khả năng tự quên thông tin cũ, hợp nhất dữ liệu trùng lặp và phát hiện các mâu thuẫn logic. Được viết bằng ngôn ngữ Rust, công cụ này hỗ trợ nhiều phương thức triển khai từ nhúng, server đến giao thức MCP.

Các cơ sở dữ liệu vector (vector databases) hiện nay chủ yếu chỉ đóng vai trò lưu trữ "ký ức" cho AI mà không thực sự quản lý chúng. Khi số lượng ký ức vượt quá ngưỡng 10.000, chất lượng truy xuất thông tin bắt đầu suy giảm do thiếu sự hợp nhất, không có cơ chế quên thông tin cũ và không giải quyết được các xung đột dữ liệu. Kết quả là tác nhân AI của bạn trở nên "ồn ào" và kém chính xác hơn.

YantrikDB ra đời như một giải pháp khác biệt: một động cơ bộ nhớ nhận thức (cognitive memory engine). Bạn có thể nhúng nó vào ứng dụng, chạy dưới dạng server độc lập hoặc kết nối qua giao thức MCP. YantrikDB không chỉ lưu trữ mà còn thực sự "suy nghĩ" về dữ liệu mà nó nắm giữ.

Docker Image Version

Ba tính năng cốt lõi khác biệt

Khác với các giải pháp lưu trữ truyền thống, YantrikDB tập trung vào việc mô phỏng cách hoạt động của bộ nhớ con người:

1. Nó biết cách quên (Forgetting)

Bộ nhớ con người không lưu giữ mọi thứ vĩnh viễn. YantrikDB sử dụng cơ chế suy giảm theo thời gian (temporal decay) với chu kỳ bán rã (half-life) có thể cấu hình. Các ký ức ít quan trọng sẽ dần mờ đi và điểm liên quan của chúng sẽ giảm xuống theo thời gian, giúp hệ thống tập trung vào thông tin mới và quan trọng hơn.

2. Nó tự hợp nhất (Consolidation)

Khi có quá nhiều mảnh ký ức tương tự về cùng một sự kiện (ví dụ: 20 ghi chú về một cuộc họp), YantrikDB có thể tự động gom chúng lại thành một số lượng nhỏ các ký ức chuẩn. Điều này giúp giảm thiểu sự dư thừa và làm sạch dữ liệu.

3. Nó phát hiện mâu thuẫn (Contradiction Detection)

Đây là tính năng mạnh mẽ nhất. Nếu hệ thống ghi nhận "CEO là Alice" và sau đó ghi thêm "CEO là Bob" trong một cuộc hội thoại khác, YantrikDB sẽ tự động phát hiện xung đột này và gắn cờ cảnh báo. Nó không đoán xem thông tin nào đúng, mà tạo ra một phân đoạn xung đột để AI hoặc con người có thể giải quyết sau này.

Các cách triển khai

YantrikDB rất linh hoạt trong việc tích hợp vào quy trình làm việc của các nhà phát triển:

Dưới dạng Network Server

Bạn có thể chạy YantrikDB như một dịch vụ microservice sử dụng Docker hoặc Kubernetes. Nó hỗ trợ cụm HA (High Availability) với 2 voter và 1 witness, cung cấp metrics qua Prometheus và mã hóa dữ liệu khi nghỉ ngơi (AES-256-GCM).

docker run -p 7438:7438 ghcr.io/yantrikos/yantrikdb:latest
curl -X POST http://localhost:7438/v1/remember -d '{"text":"hello"}'

Dưới dạng MCP Server

Đối với những người sử dụng các công cụ lập trình hỗ trợ AI như Claude Code, Cursor hoặc Windsurf, YantrikDB cung cấp một máy chủ MCP. Khi được cấu hình, tác nhân AI sẽ tự động truy xuất ngữ cảnh, ghi nhớ các quyết định và phát hiện mâu thuẫn mà không cần prompting thủ công.

Nhúng trực tiếp (Embedded Library)

YantrikDB được viết bằng Rust và cung cấp binding cho Python, cho phép nhúng trực tiếp vào ứng dụng của bạn giống như SQLite.

PyPI Version

import yantrikdb
db = yantrikdb.YantrikDB("memory.db", embedding_dim=384)
db.record("Alice leads engineering", importance=0.8)
db.recall("who leads the team?", top_k=3)
db.think()  # hợp nhất, phát hiện xung đột, suy luận tính cách

Hiệu suất và Tối ưu hóa

Theo các bài kiểm tra thực tế trên một cụm LXC 2 nhân, YantrikDB cho thấy hiệu suất ấn tượng:

Độ trễ truy xuất (Recall p50): ~112ms (phần lớn thời gian dành cho việc tạo embedding).
Nếu sử dụng embedding được tính toán sẵn, độ trễ giảm xuống chỉ còn ~5ms.
Ghi hàng loạt: 76 ghi/giây.

Đặc biệt, so với phương pháp lưu trữ bộ nhớ dựa trên file (như việc đổ toàn bộ dữ liệu vào file CLAUDE.md), YantrikDB giúp tiết kiệm cực kỳ nhiều token. Với 5.000 ký ức, phương pháp file-based có thể tốn tới 101.739 token, trong khi YantrikDB chỉ tốn khoảng 53 token cho mỗi truy vấn nhờ cơ chế lọc và nén thông tin thông minh.

Kiến trúc và Tính năng kỹ thuật

YantrikDB được thiết kế theo nguyên tắc "Local-first" (ưu tiên cục bộ) và sử dụng CRDT (Conflict-free Replicated Data Types) để đồng bộ dữ liệu giữa các thiết bị mà không gây xung đột.

Hệ thống sử dụng 5 chỉ mục (indexes) trong cùng một động cơ:

Vector Index (HNSW): Tìm kiếm tương đồng ngữ nghĩa.
Graph Index: Quản lý quan hệ thực thể.
Temporal Index: Truy vấn nhận thức thời gian.
Decay Heap: Quản lý điểm quan trọng suy giảm.
Key-Value Store: Lưu trữ sự kiện nhanh và trạng thái phiên.

Hiện tại, dự án đang ở phiên bản v0.5.11 (hardened alpha) và đã được sử dụng trong hệ sinh thái YantrikOS. Mã nguồn được phát hành dưới giấy phép AGPL-3.0, trong khi máy chủ MCP được cấp phép MIT để khuyến khích sử dụng rộng rãi trong cộng đồng phát triển AI.

YantrikDB: Động cơ bộ nhớ nhận thức cho AI, biết cách quên và tự phát hiện mâu thuẫn

Ba tính năng cốt lõi khác biệt

1. Nó biết cách quên (Forgetting)

2. Nó tự hợp nhất (Consolidation)

3. Nó phát hiện mâu thuẫn (Contradiction Detection)

Các cách triển khai

Dưới dạng Network Server

Dưới dạng MCP Server

Nhúng trực tiếp (Embedded Library)

Hiệu suất và Tối ưu hóa

Kiến trúc và Tính năng kỹ thuật

Bài viết liên quan