Cung cấp cho AI ngữ cảnh không giới hạn và luôn được cập nhật

Bài viết này khám phá kiến trúc đằng sau một lớp kiến thức di động và quy trình tự động hóa giúp duy trì sự sống cho nó. Chúng ta sẽ tìm hiểu cách xây dựng hệ thống "LLM Wiki" theo ý tưởng của Andrej Karpathy để biến AI thành trợ lý có bộ nhớ dài hạn thực sự.

Andrej Karpathy, một trong những thành viên sáng lập của OpenAI, đã đăng tải một GitHub gist vào đầu năm nay mang tên "LLM Wiki". Gist dài khoảng 1.500 từ này mô tả một mô hình trong đó bạn xây dựng một wiki cá nhân được LLM duy trì cho bạn: một hiện vật (artifact) bền vững và tích lũy, ngày càng phong phú hơn mỗi khi bạn thêm vào đó.

Đó là kiến thức được biên soạn một lần và giữ cho nó luôn cập nhật, thay vì phải suy diễn lại từ đầu trong mỗi lần truy vấn. Hầu hết mọi người có thể đọc xong, nghĩ "thú vị đấy", và rồi đóng tab. Nhưng tác giả bài viết đã thực sự xây dựng nó, và dưới đây là hướng dẫn thiết lập chi tiết cũng như những bài học rút ra từ quá trình triển khai.

Hình ảnh minh họa kiến trúc hệ thống

Vấn đề với cách hầu hết mọi người sử dụng AI hiện nay

Mọi cuộc trò chuyện đều bắt đầu từ con số không. Bạn mở một cửa sổ chat, giải thích bạn là ai, bạn đang làm việc gì, và bạn đã quyết định điều gì vào tuần trước. Bạn nhận được một phản hồi hữu ích. Bạn đóng tab. Ngày mai, bạn lại làm lại y hệt.

Công cụ hoạt động tốt, nhưng lớp ngữ cảnh bên dưới nó đang bị thiếu lót! Dù bộ nhớ tích hợp sẵn có giúp ích một chút (ví dụ: Claude nhớ tên của bạn, ChatGPT biết bạn thích gạch đầu dòng), nhưng không AI nào biết chi tiết về các dự án đang hoạt động của bạn, thương vụ sắp chốt, nhà cung cấp bạn đã loại bỏ tháng trước, hoặc những gì đã xảy ra trong pipeline của bạn tuần này.

Loại trạng thái vận hành đó không tồn tại ở bất cứ đâu một cách bền vững!

Giải pháp thay thế: RAG và cách tiếp cận "Kho lưu trữ"

Các kỹ sư thường nghĩ đến RAG (Retrieval-Augmented Generation) như một giải pháp. RAG thực sự hữu ích, nhưng nó đang giải quyết một vấn đề khác. Nó suy diễn lại kiến thức từ đầu trong mỗi lần truy vấn. Bạn nhúng tài liệu, truy xuất các đoạn văn tại thời điểm truy vấn và hy vọng các mảnh đúng sẽ nổi lên. Không có gì được tích lũy cả.

Câu hỏi đòi hỏi sự tổng hợp của năm tài liệu có nghĩa là LLM phải tìm và lắp ráp lại các mảnh đó mỗi lần. Cách tiếp cận "kho lưu trữ" (vault) của bài viết này biên soạn kiến thức một lần và giữ cho nó cập nhật. Khi bạn thêm cái mới, LLM sẽ lập chỉ mục, đọc, tích hợp, cập nhật các trang liên quan, đánh dấu các mâu thuẫn và duy trì các tham chiếu chéo.

Sự tổng hợp đã được thực hiện trước khi bạn đặt câu hỏi tiếp theo. Như Karpathy đã nói: wiki là một hiện vật bền vững, tích lũy.

Kiến trúc: Hai thư mục và một tệp lược đồ

Cấu trúc cốt lõi nằm gọn trong một cây thư mục đơn giản:

Raw/: Chứa các tài liệu nguồn bất biến (biên bản cuộc họp, tài liệu, v.v.). Nguyên tắc là tuyệt đối: AI chỉ đọc Raw, không bao giờ chỉnh sửa. Đây là vùng hạ cánh (landing zone).
Wiki/: Chứa nội dung do LLM tạo ra, có cấu trúc và được lập chỉ mục (Dự án, Con người, Quyết định, v.v.). Đây là lớp được biên tập kỹ lưỡng. AI sẽ đọc phần này đầu tiên khi bạn đặt câu hỏi.

Nếu bạn từng làm việc với các pipeline dữ liệu, sự tách biệt này rất quen thuộc. Raw là nguồn sự thật. Wiki là lớp được biên tập. Nếu Wiki bị lệch hoặc hỏng, bạn xây dựng lại từ Raw. Bạn không bao giờ mất nguồn.

Sơ đồ cấu trúc thư mục Raw và Wiki

Ba tệp điều khiển quan trọng

Đây là phần hầu hết các triển khai bỏ qua, và lý do tại sao chúng âm thầm thất bại. Một thư mục chứa các tệp markdown không phải là một hệ thống. Ba tệp này biến nó thành một hệ thống:

_hot.md: Bộ nhớ đệm. Mỗi buổi sáng, tác vụ tự động hàng ngày ghi đè tệp này với các chủ đề hoạt động nhất, các số liệu hoặc hạn chót quan trọng, và một dòng tóm tắt về bất kỳ việc gì khẩn cấp. Nó giữ dưới 500 token. Khi bạn mở cuộc trò chuyện và muốn một bản tóm tắt nhanh, AI đọc _hot.md trước.
_pending.md: Hàng đợi. Mỗi khi một tệp mới được đưa vào Raw, tên tệp và ngày tháng của nó được thêm vào đây. Khi tác vụ biên soạn hàng tuần chạy, nó đọc tệp này, xử lý từng mục, biên soạn vào Wiki và đánh dấu là [ĐÃ BIÊN SOẠN — 2026-05-01].
_log.md: Nhật ký kiểm tra. Mỗi lần chạy tự động sẽ thêm một mục có dấu thời gian: cái gì đã chạy, tệp nào được xử lý, trang Wiki nào được tạo hoặc cập nhật. Nếu hệ thống bị lệch, đây là cách bạn tìm ra nguyên nhân.

Tệp lược đồ: Dạy cho bất kỳ AI nào cách đọc kho của bạn

Tệp lược đồ (ví dụ: CLAUDE.md) là điểm nhập. Mọi phiên làm việc đều bắt đầu ở đây. Nó chứa bản đồ thư mục, thứ tự đọc và các quy tắc cứng (ví dụ: "không bao giờ chỉnh sửa tệp trong Raw/").

Tệp lược đồ cũng là nơi bạn mã hóa các mặc định về câu lệnh (prompt). Một triết lý câu lệnh đáng được mã hóa rõ ràng:

Ngữ cảnh đánh bại câu lệnh. Hãy cung cấp cho AI các tệp, không phải chỉ dẫn.
Ví dụ đánh bại sự quy định. Hãy cho thấy bạn muốn gì, đừng chỉ mô tả.
Ràng buộc đánh bại quy tắc. Hãy nói đầu ra KHÔNG phải là gì, để AI chọn cách.
Mục tiêu đánh bại chỉ dẫn. Hãy nói cần đạt được gì, không phải cách làm.

Lớp tự động hóa: Ba nhịp độ, không phải một

Giải pháp là tách biệt các công việc. Hãy cùng khám phá:

Hàng ngày (vào buổi sáng các ngày trong tuần): Chỉ nhập liệu

Kéo dữ liệu từ các nguồn của bạn. Thả các tệp mới vào Raw/. Đưa chúng vào hàng đợi trong _pending.md. Ghi đè _hot.md dựa trên những gì vừa tìm thấy. Không chỉnh sửa Wiki. Công việc hàng ngày mang tính cơ học, nhanh và đủ an toàn để chạy không cần giám sát mỗi ngày.

Hàng tuần (vào buổi sáng thứ Hai): Biên soạn

Đọc _pending.md. Đối với mỗi tệp chưa xử lý, đọc toàn bộ, tạo một trang Wiki có cấu trúc trong thư mục miền phù hợp, cập nhật chỉ mục liên quan, thêm backlink và đánh dấu mục là đã biên soạn. Công việc hàng tuần thực hiện việc diễn giải. Nó tổng hợp nội dung thô thành kiến thức có cấu trúc.

Hàng tháng (ngày mùng 1): Kiểm tra và dọn dẹp (Linting)

Chỉ kiểm tra sức khỏe. Quét toàn bộ Wiki để tìm các trang cũ kỹ, các backlink bị thiếu, mâu thuẫn giữa các trang và các trang mồ côi. Viết một tệp báo cáo. Đừng tự động sửa bất cứ thứ gì. Công việc hàng tháng không bao giờ chạm trực tiếp vào nội dung Wiki. Ranh giới này giúp nó an toàn khi chạy mà không cần giám sát.

Quy trình tự động hóa hàng ngày, hàng tuần và hàng tháng

Những gì thực sự thay đổi

Bạn ngừng giải thích về bản thân mình, và các cuộc trò chuyện sẽ thay đổi tính chất. Khi ngữ cảnh đã được tải sẵn, bạn ngừng sử dụng AI cho các câu hỏi cô lập và bắt đầu sử dụng nó cho công việc thực sự.

AI biết các dự án đang mở, các quyết định gần đây của bạn và đội nhóm của bạn. Bạn hỏi "hôm nay tôi nên ưu tiên cái gì?" và nó đọc _hot.md cùng với các tệp dự án của bạn để đưa ra câu trả lời dựa trên thực tế.

Tính di động là một lợi ích khác! Ngữ cảnh của bạn sống trong một thư mục trên máy của bạn, không phải bên trong hệ thống bộ nhớ của bất kỳ AI nào. Hãy trỏ một AI khác vào cùng một thư mục đó và nó sẽ đọc các tệp tương tự. Bạn có thể thay đổi công cụ bất cứ khi nào muốn. Kho lưu trữ sẽ đi theo bạn.

Lời kết

Phần tẻ nhạt của việc duy trì một cơ sở kiến thức không phải là việc đọc hay suy nghĩ. Đó là việc sổ sách. Cập nhật các tham chiếu chéo, giữ cho các bản tóm tắt được cập nhật, ghi chú khi dữ liệu mới mâu thuẫn với các tuyên bố cũ. Con người bỏ qua wiki vì gánh nặng bảo trì tăng nhanh hơn giá trị nó mang lại.

LLM không bao giờ chán, không bao giờ quên cập nhật một tham chiếu chéo, và có thể chạm vào 15 tệp chỉ trong một lần chạy. Bạn thiết lập hệ thống này một lần. Sau đó, AI của bạn sẽ không bao giờ bắt đầu từ con số không nữa.

Cung cấp cho AI ngữ cảnh không giới hạn và luôn được cập nhật

Vấn đề với cách hầu hết mọi người sử dụng AI hiện nay

Giải pháp thay thế: RAG và cách tiếp cận "Kho lưu trữ"

Kiến trúc: Hai thư mục và một tệp lược đồ

Ba tệp điều khiển quan trọng

Tệp lược đồ: Dạy cho bất kỳ AI nào cách đọc kho của bạn

Lớp tự động hóa: Ba nhịp độ, không phải một

Những gì thực sự thay đổi

Lời kết

Bài viết liên quan