Ảo giác trong AI: Siêu nhận thức là chìa khóa để xây dựng lại niềm tin

Một nghiên cứu mới từ arXiv chỉ ra rằng việc mở rộng kiến thức không giải quyết được triền miên vấn đề "ảo giác" trong các mô hình ngôn ngữ lớn (LLM). Thay vào đó, các tác giả đề xuất phương pháp "siêu nhận thức" (metacognition), giúp AI nhận thức và bày tỏ sự không chắc chắn một cách trung thực để nâng cao độ tin cậy.

Mặc dù trí tuệ nhân tạo tạo sinh (Generative AI) đã đạt được những bước tiến vượt bậc về độ tin cậy trong các vấn đề thực tế, nhưng lỗi sai – thường được gọi là ảo giác (hallucinations) – vẫn là một mối lo ngại lớn. Điều này đặc biệt đúng khi các mô hình ngôn ngữ lớn (LLM) ngày càng được kỳ vọng sẽ hỗ trợ trong các tình huống phức tạp và tinh vi hơn.

Một bài nghiên cứu mới trên arXiv có tựa đề "Hallucinations Undermine Trust; Metacognition is a Way Forward" (Ảo giác làm xói mòn niềm tin; Siêu nhận thức là hướng đi phía trước) của các tác giả Gal Yona, Mor Geva và Yossi Matias đã chỉ ra rằng ngay cả trong các thiết lập đơn giản nhất như trả lời câu hỏi sự kiện, các mô hình tiên tiến nhất vẫn tiếp tục tạo ra ảo giác.

Giới hạn của việc mở rộng kiến thức

Nghiên cứu lập luận rằng hầu hết các cải tiến về tính thực tế trong lĩnh vực này cho đến nay đều đến từ việc mở rộng ranh giới kiến thức của mô hình (mã hóa thêm nhiều sự thật), chứ không phải từ việc cải thiện nhận thức về ranh giới đó (khả năng phân biệt cái đã biết và cái chưa biết).

Các tác giả cho rằng việc phân biệt hoàn hảo giữa sự thật và sai lầm là một nhiệm vụ vốn dĩ khó khăn đối với các mô hình. Điều này tạo ra một sự đánh đổi không thể tránh khỏi giữa việc loại bỏ ảo giác và việc duy trì tính hữu ích của mô hình. Nếu cố gắng quá mức để tránh sai sót, mô hình có thể trở nên quá thận trọng và từ chối trả lời quá nhiều câu hỏi mà nó thực sự có thể xử lý.

Siêu nhận thức: Con đường thứ ba

Theo bài viết, sự đánh đổi này có thể được giải quyết dưới một góc nhìn khác. Nếu chúng ta hiểu ảo giác là những lỗi sai tự tin – tức là cung cấp thông tin sai lệch mà không có sự điều chỉnh thích hợp – thì một con đường thứ ba sẽ xuất hiện bên ngoài lối mòn "trả lời hoặc từ chối" truyền thống. Đó là: bày tỏ sự không chắc chắn.

Các tác giả đề xuất khái niệm "sự không chắc chắn trung thực" (faithful uncertainty): việc đồng bộ hóa sự không chắc chắn về ngôn ngữ với sự không chắc chắn nội tại của mô hình. Đây là một khía cạnh của siêu nhận thức (metacognition) – khả năng nhận thức được sự không chắc chắn của bản thân và hành động dựa trên nó.

Tầm quan trọng đối với hệ thống AI tương lai

Đối với các tương tác trực tiếp, hành động dựa trên sự không chắc chắn có nghĩa là truyền đạt nó một cách trung thực cho người dùng. Đối với các hệ thống tác nhân AI (agentic systems), sự không chắc chắn trở thành lớp kiểm soát, quyết định khi nào cần tìm kiếm thêm thông tin và khi nào nên tin vào dữ liệu hiện có.

Nghiên cứu kết luận rằng siêu nhận thức là yếu tố thiết yếu để các LLM vừa có thể đáng tin cậy, vừa có thể duy trì khả năng xử lý mạnh mẽ. Các tác giả cũng nhấn mạnh những vấn đề còn mở cần được giải quyết để đạt được mục tiêu này trong tương lai.

Ảo giác trong AI: Siêu nhận thức là chìa khóa để xây dựng lại niềm tin

Giới hạn của việc mở rộng kiến thức

Siêu nhận thức: Con đường thứ ba

Tầm quan trọng đối với hệ thống AI tương lai

Bài viết liên quan