Các mô hình ngôn ngữ lớn cũng cần "ngủ" để giải quyết vấn đề bộ nhớ dài hạn

Một nghiên cứu mới từ các nhà khoa học máy tính đã đề xuất cơ chế "giấc ngủ" nhân tạo cho các mô hình ngôn ngữ, giúp chúng chuyển đổi ngữ cảnh thành bộ nhớ dài hạn hiệu quả hơn. Phương pháp này cho phép mô hình duy trì độ trễ thấp trong quá trình suy luận nhưng vẫn cải thiện đáng kể khả năng xử lý các tác vụ phức tạp và dài.

Các mô hình ngôn ngữ lớn (LLM) hiện nay đang ngày càng được ứng dụng vào các tác vụ đòi hỏi theo dõi ngữ cảnh trong thời gian dài. Tuy nhiên, một thách thức lớn của kiến trúc Transformer truyền thống là cơ chế chú ý (attention mechanism) hoạt động kém hiệu quả khi độ dài của ngữ cảnh tăng lên, gây tốn kém về tính toán và bộ nhớ.

Để giải quyết vấn đề này, một bài báo nghiên cứu mới mang tên "Language Models Need Sleep" (Các mô hình ngôn ngữ cần ngủ) đã đề xuất một cơ chế củng cố (consolidation) mô phỏng giấc ngủ của con người.

Cơ chế "ngủ" củng cố bộ nhớ

Thay vì cố gắng lưu trữ toàn bộ lịch sử ngữ cảnh trong bộ nhớ đệm key-value (KV cache) – vốn gây ra sự quá tải, phương pháp mới này cho phép mô hình định kỳ chuyển đổi ngữ cảnh gần đây thành các trọng số nhanh (fast weights) bền vững trước khi xóa bộ nhớ đệm.

Quá trình này diễn ra như sau:

Trong giai đoạn "ngủ", mô hình thực hiện $N$ lần lặp lại (recurrent passes) ngoại tuyến trên ngữ cảnh đã tích lũy.
Mô hình cập nhật các trọng số nhanh trong các khối mô hình không gian trạng thái (SSM blocks) thông qua một quy tắc cục bộ đã được học.
Điều này giúp chuyển dịch phần lớn tính toán sang giai đoạn ngủ, giúp giữ cho độ trễ (latency) khi dự đoán ở trạng thái thức (wake-time) vẫn thấp.

Kết quả thử nghiệm ấn tượng

Các nhà nghiên cứu đã kiểm tra phương pháp này trên các tác vụ tổng hợp được kiểm soát, bao gồm tự động hóa tế bào (cellular automata) và truy xuất đồ thị đa bước (multi-hop graph retrieval), cũng như một tác vụ suy luận toán học thực tế.

Kết quả cho thấy:

Các mô hình Transformer thông thường cũng như các mô hình lai SSM-attention đều thất bại trong các bài toán này.
Mô hình áp dụng cơ chế "ngủ" hoạt động hiệu quả hơn nhiều.
Đặc biệt, việc tăng thời lượng ngủ ($N$) giúp cải thiện hiệu suất, với mức tăng lớn nhất ở các ví dụ đòi hỏi khả năng suy luận sâu hơn.

Tương lai của AI và trí nhớ dài hạn

Nghiên cứu này mở ra hướng đi mới trong việc thiết kế các hệ thống AI có khả năng quản lý bộ nhớ tương tự như sinh vật học. Bằng cách tách biệt giai đoạn xử lý thông tin (ngủ) và giai đoạn phản hồi (thức), các mô hình ngôn ngữ trong tương lai có thể vượt qua các giới hạn hiện tại về độ dài ngữ cảnh mà không làm giảm tốc độ xử lý.

Phương pháp này hứa hẹn sẽ cải thiện đáng kể hiệu suất của các chatbot AI, trợ lý ảo và các hệ thống tự động hóa trong việc xử lý các cuộc hội thoại dài hoặc các dự án phức tạp đòi hỏi duy trì trạng thái trong thời gian dài.

Các mô hình ngôn ngữ lớn cũng cần "ngủ" để giải quyết vấn đề bộ nhớ dài hạn

Cơ chế "ngủ" củng cố bộ nhớ

Kết quả thử nghiệm ấn tượng

Tương lai của AI và trí nhớ dài hạn

Bài viết liên quan