Báo cáo AI của KPMG vô tình trở thành ví dụ điển hình về hiện tượng "ảo giác" của AI

Một phân tích từ GPTZero cho thấy báo cáo về AI của KPMG chứa đựng hàng loạt lỗi trích dẫn và thông tin sai lệch, biến nó thành một ví dụ điển hình về hiện tượng "ảo giác" của trí tuệ nhân tạo. Chỉ có 5 trong số 45 trích dẫn trong báo cáo là chính xác, khiến công ty kiểm toán hàng đầu này phải gỡ bỏ tài liệu để điều tra.

Báo cáo tháng 10 năm 2025 của KPMG với tựa đề "Total Experience: Redefining Excellence in the Age of Agentic AI" (Trải nghiệm tổng thể: Định nghĩa lại sự xuất sắc trong kỷ nguyên AI tác nhân) đang vấp phải chỉ trích nặng nề. Thay vì ca ngợi khả năng của trí tuệ nhân tạo, tài liệu này bị cáo buộc đã phơi bày một trong những khuyết điểm lớn nhất của công nghệ này: việc bịa đặt thông tin.

Theo công ty nghiên cứu GPTZero, một cuộc kiểm tra kỹ lưỡng báo cáo của "Tứ đại" kiểm toán này cho thấy chỉ có 5 trong số 45 trích dẫn là dẫn đúng đến nguồn gốc. Phần còn lại hoặc bị sai lệch, gây hiểu lầm, hoặc được bịa đặt một phần, thậm chí quá mơ hồ để có thể xác minh được tính chính xác.

"Vibe citing": Trích dẫn theo cảm hứng

GPTZero đã đặt tên cho hiện tượng này là "vibe citing" (trích dẫn theo cảm hứng) – tương tự như thuật ngữ "vibe coding" trong lập trình. Đây là trường hợp AI tạo sinh dường như đã ghép lại các mảnh nguồn thật, bịa ra tiêu đề, hoặc tạo ra các tài liệu tham khảo trông có vẻ thuyết phục về mặt hình thức cho đến khi ai đó thực sự bấm vào kiểm tra.

GPTZero cáo buộc rằng khoảng một nửa các tuyên bố sự kiện trong báo cáo là sai, không có cơ sở hoặc bị gán nhầm nguồn. Nhiều nghiên cứu điển hình (case studies) được đưa ra để làm nổi bật việc triển khai AI tác nhân tiên tiến dường như đã được "sáng tạo" khá táo bạo.

Các ví dụ sai lệch cụ thể

Trong số các ví dụ bị GPTZero chỉ ra, các dự án triển khai AI tác nhân được cho là tại UBS, Đường sắt Liên bang Thụy Sĩ và Transport for London đều có vấn đề. Các nguồn được trích dẫn để hỗ trợ các nghiên cứu điển hình này hoặc không chứng minh được các tuyên bố của báo cáo, hoặc chứa các thay đổi và diễn giải làm suy yếu độ tin cậy của chúng.

"Những lỗi thực tế này không chỉ giới hạn ở các đoạn chú thích của báo cáo," GPTZero nhận định. "Ở trang 42, các tác giả tuyên bố rằng hãng hàng không Emirates đã áp dụng một chatbot di động tên là Sara (sai) có thể trò chuyện trực tiếp với hành khách (đúng một phần) và thay đổi chuyến bay của họ (sai)."

Thực tế, Sara là một trợ lý robot được Emirates giới thiệu năm 2023 (không phải chatbot) và hoàn toàn không có khả năng thay đổi đặt chỗ chuyến bay.

Mâu thuẫn nội bộ và phản ứng của KPMG

Không chỉ sai lệch về nguồn bên ngoài, báo cáo còn mâu thuẫn với nghiên cứu riêng của KPMG. Trong khi báo cáo này dẫn rằng 55% CEO xếp hạng AI là ưu tiên đầu tư hàng đầu, thì báo cáo "CEO Outlook" của KPMG ra mắt cùng tháng lại đưa ra con số là 71%.

Hiện tại, KPMG đã gỡ bỏ báo cáo khỏi một số trang web của mình để điều tra cách thức mà tài liệu này được phát hành rộng rãi.

Một phát ngôn viên của KPMG chia sẻ với The Register: "KPMG International coi trọng tính chính xác và toàn vẹn của nội dung được xuất bản. Báo cáo đã bị gỡ bỏ và chúng tôi đang xem xét các hoàn cảnh xung quanh việc công bố này. Chúng tôi mong đợi tất cả nhân viên tuân thủ các hướng dẫn về sử dụng AI có trách nhiệm, bao gồm sự giám sát của con người để xác thực nội dung và xác minh các nguồn độc lập."

Các công ty tư vấn đã dành nhiều năm cảnh báo khách hàng về rủi ro ảo giác của AI. Tuy nhiên, theo GPTZero, KPMG có thể vừa vô tình cung cấp một bài trình diễn trực tiếp về chính rủi ro mà họ luôn cảnh báo.

Báo cáo AI của KPMG vô tình trở thành ví dụ điển hình về hiện tượng "ảo giác" của AI

"Vibe citing": Trích dẫn theo cảm hứng

Các ví dụ sai lệch cụ thể

Mâu thuẫn nội bộ và phản ứng của KPMG

Bài viết liên quan