Từ "Có thể" đến "Xác suất": Thách thức xây dựng mô hình AI đáng tin cậy

Bài viết phân tích ranh giới mong manh giữa khả năng lý thuyết và độ tin cậy thực tế trong các mô hình AI tạo sinh. Tác giả giải thích cơ sở xác suất đằng sau hiện tượng ảo giác và đề xuất các phương pháp kỹ thuật để chuyển đổi các hệ thống AI từ việc chỉ "có thể" hoạt động sang hoạt động một cách nhất quán và đáng tin cậy.

Trong vài năm qua, hầu hết chúng ta đều đã tham gia vào vô số cuộc thảo luận về AI tạo sinh (Generative AI). Từ những cuộc trò chuyện phi kỹ thuật với công chúng về cách sử dụng AI, đến các tranh luận chuyên sâu về độ chính xác của mô hình, mọi người đều bị cuốn hút bởi khả năng của chúng.

Một mô hình ngôn ngữ lớn (LLM) có thể viết một trình điều khiển nhân (kernel driver) hoạt động được không? Có thể. Nó có thể sáng tác một bài hát về chú mèo cưng của bạn không? Chắc chắn rồi. Một mô hình khuếch tán (diffusion model) có thể tạo ra hình ảnh chân thực về một phi hành gia thời trung cổ không? Tất nhiên là được.

Tuy nhiên, câu hỏi quan trọng không phải là AI "có thể" làm gì, mà là việc đó có thực sự tốt không? Thực tế cho thấy, tiêu chuẩn để một việc trở nên "có thể" đối với hầu hết các mô hình hiện nay là khá thấp.

1. Chiều dữ liệu và Không gian Khả năng

Để hiểu tại sao độ tin cậy lại là một thách thức lớn đến vậy, chúng ta cần nhìn lại khái niệm không gian mẫu trong xác suất. Với một lần tung đồng xu, không gian khả năng rất nhỏ và dễ hình dung. Nhưng hãy xem xét một mô hình ngôn ngữ tạo ra một chuỗi 512 token với vốn từ vựng 50.000 từ. Không gian mẫu ở đây có kích thước lên tới 50000 mũ 512 — một con số khổng lồ mà con người khó có thể hình dung.

Trong một không gian khổng lồ như vậy, vùng tương ứng với các đầu ra hữu ích, mạch lạc và đúng sự thật thực sự rất nhỏ so với số lượng các phương án thay thế khác. Nói cách khác, trong biển cả các khả năng, những gì có xác suất cao (probable) chỉ như một cái ao nhỏ.

Khi mô hình trả về một câu trả lời nằm trong vùng "có thể" nhưng không nằm trong vùng "xác suất cao", chúng ta gọi đó là ảo giác (hallucination). Ảo giác không nhất thiết là một lỗi phần mềm, mà là hệ quả tất yếu khi mô hình lấy mẫu từ các vùng của phân phối xác suất có giá trị khác không nhưng lại ít giá trị thực tiễn.

Minh họa về không gian mẫu và vấn đề ảo giác trong AI

2. Đo lường Tần suất so với Kỳ vọng Bayes

Khi đánh giá hệ thống AI, thường có hai cách tiếp cận. Cách đầu tiên là góc nhìn của người theo trường phái tần suất (Frequentist): chạy 1000 bài kiểm tra chuẩn và đo hiệu suất. Nếu mô hình giải đúng 850 bài, chúng ta gọi nó là hệ thống có độ chính xác 85%.

Cách thứ hai là góc nhìn Bayes, nơi chúng ta bắt đầu với kỳ vọng về cách một hệ thống thông minh nên hoạt động và cập nhật niềm tin đó khi các thất bại bất ngờ xảy ra.

Sự khác biệt này trở nên quan trọng vì các câu lệnh (prompt) hiếm khi là các sự kiện độc lập. Nếu một mô hình trả lời đúng chín câu toán học, chúng ta có thể giả định xác suất trả lời đúng câu thứ mười là 85%. Tuy nhiên, các mô hình ngôn ngữ không phải là một tập hợp các phép thử Bernoulli độc lập. Đầu ra của chúng phụ thuộc vào ngữ cảnh trước đó và mật độ của các ví dụ liên quan trong dữ liệu huấn luyện. Điều này có nghĩa là hiệu suất của chúng thường mang tính điều kiện (conditional) thay vì tĩnh.

3. Sự tự tin không đồng nghĩa với Xác suất

Một trong những hàm phổ biến nhất trong học máy là Softmax. Chúng ta thường diễn giải đầu ra của Softmax là điểm số tự tin: "Nếu mô hình xuất ra 0,90 cho con mèo, nó 90% chắc chắn". Tuy nhiên, cách hiểu này có thể gây hiểu lầm.

Hàm Softmax sử dụng số mũ, do đó những khác biệt nhỏ giữa các logits có thể được khuếch đại mạnh mẽ. Một mô hình có thể trông rất tự tin không phải vì nó "biết" điều gì đó, mà đơn giản là vì một logit tình cờ lớn hơn các logit khác một chút và phép toán mũ đã khuếch đại sự khác biệt đó.

Điều này tạo ra vấn đề mà tôi gọi là "kẻ ngốc tự tin": một hệ thống khẳng định sai một cách rất tự tin vì nó chưa học được cách thể hiện sự không chắc chắn.

Minh họa về hàm Softmax và vấn đề độ tự tin quá mức

4. Quy luật Số lớn và Dữ liệu không đồng nghĩa với Sự thật

Quy luật Số lớn phát biểu rằng khi kích thước mẫu tăng lên, trung bình quan sát sẽ tiệm cận với giá trị kỳ vọng. Điều này thường thúc đẩy việc sử dụng các tập dữ liệu khổng lồ để huấn luyện mô hình. Nếu mô hình thấy đủ ví dụ, cuối cùng nó sẽ học được sự thật, đúng không?

Vấn đề nằm ở chỗ ngôn ngữ và kiến thức của con người không phải là các phân phối ổn định. Chúng thay đổi liên tục và chứa đầy mâu thuẫn, thiên kiến và sự không chính xác. Kết quả là, mô hình không nhất thiết hội tụ về "sự thật". Thay vào đó, nó hội tụ về các "mẫu hình phổ biến". Nếu một quan niệm sai lầm xuất hiện đủ thường xuyên trong dữ liệu, mô hình có thể sẽ học nó vì về mặt thống kê, đó là phần tiếp theo có xác suất cao nhất.

5. Tính ngẫu nhiên không phải là Sáng tạo

Nhiều người thường mô tả các hệ thống AI là "sáng tạo" khi chúng tạo ra các đầu ra bất ngờ. Tuy nhiên, dưới góc độ xác suất, điều gì đó khác đang diễn ra.

Việc lấy mẫu theo nhiệt độ (temperature sampling) thay đổi khả năng mô hình chọn các token ít xác suất hơn. Mẫu có nhiệt độ thấp an toàn và dễ đoán, trong khi mẫu có nhiệt độ cao thường đa dạng và bất ngờ hơn, thường dẫn đến rủi ro ảo giác cao hơn.

Tăng nhiệt độ lấy mẫu thực chất làm phẳng phân phối xác suất, nghĩa là các kết quả có xác suất thấp sẽ được lấy mẫu thường xuyên hơn. Những gì chúng ta đôi khi gọi là sáng tạo có thể chỉ là mô hình đang khám phá các vùng ít khả năng xảy ra của phân phối.

Minh họa về tác động của nhiệt độ đến quá trình lấy mẫu

6. Chuyển dịch từ Có thể đến Đáng tin cậy

Nếu mục tiêu của chúng ta là xây dựng các hệ thống AI hoạt động nhất quán trong môi trường thực, chúng ta cần vượt qua câu hỏi "có thể không" và tập trung vào độ tin cậy. Một số phương pháp hữu ích bao gồm:

Sử dụng các kỹ thuật như Platt Scaling và Isotonic Regression để giúp căn chỉnh điểm số tự tin với hiệu suất quan sát thực tế.
Sử dụng các phương pháp như Mạng nơ-ron Bayes (Bayesian neural networks) hoặc Monte Carlo Dropout để giúp định lượng những gì mô hình không biết.
Sử dụng các phương pháp kiểm chứng bên ngoài để áp đặt cấu trúc và yêu cầu đầu ra, thay vì giả định mô hình sẽ tự nhiên tuân thủ các quy tắc.

Lời kết

Vài năm trước, mọi người ấn tượng với các hệ thống AI đơn giản là dự đoán từ tiếp theo. Giờ đây chúng ta nhận ra rằng dự đoán từ tiếp theo chỉ là một phần của vấn đề.

Thách thức khó khăn hơn là dự đoán đúng từ đó một cách lặp lại và đáng tin cậy. Đặc biệt là khi có vô số mô hình mới xuất hiện mỗi ngày với những lời hứa hẹn về hiệu suất ấn tượng. Lần tới khi bạn thấy một bản demo AI tuyệt vời, tôi khuyến khích bạn tự hỏi: "Đây là điều mô hình thường làm, hay đây là một mẫu may mắn đặc biệt?"

Trong một thế giới với khả năng gần như vô hạn, hầu hết mọi thứ đều có thể xảy ra. Nhưng kỹ thuật hiếm khi nói về những gì có thể xảy ra. Nó nói về những gì bạn có thể tin tưởng sẽ lặp lại.