Các mô hình AI của Google, OpenAI và Anthropic thất bại thảm hại khi dự đoán kết quả bóng đá

Một nghiên cứu mới cho thấy các hệ thống AI hàng đầu từ Google, OpenAI và Anthropic đã thua lỗ khi cố gắng dự đoán kết quả của Giải bóng đá Ngoại hạng Anh. Báo cáo "KellyBench" chỉ ra rằng dù AI giỏi viết code, nhưng chúng vẫn gặp khó khăn trong việc phân tích thế giới thực trong dài hạn.

Một nghiên cứu mới đây từ startup AI General Reasoning đã tiết lộ một điểm yếu đáng ngạc nhiên của các trí tuệ nhân tạo hàng đầu hiện nay: khả năng dự đoán kết quả thể thao.

Theo báo cáo "KellyBench" được công bố tuần này, các mô hình AI từ Google, OpenAI và Anthropic đều bị thua lỗ khi tham gia cá cược ảo trong suốt một mùa giải Giải bóng đá Ngoại hạng Anh (Premier League). Nghiên cứu này gợi ý rằng ngay cả những hệ thống tiên tiến nhất cũng gặp khó khăn trong việc phân tích thế giới thực trong một khoảng thời gian dài.

Thử thách "KellyBench" và kết quả bất ngờ

Công ty General Reasoning có trụ sở tại London đã kiểm tra 8 hệ thống AI hàng đầu bằng cách tái tạo lại mùa giải 2023–24 của Premier League dưới dạng ảo. Các mô hình AI này được cung cấp dữ liệu lịch sử chi tiết và các thống kê về từng đội bóng cũng như các trận đấu trước đó.

Nhiệm vụ được giao cho các AI là xây dựng các mô hình nhằm tối đa hóa lợi nhuận và quản lý rủi ro dựa trên thông tin đó. Tuy nhiên, kết quả thực tế cho thấy các hệ thống này không thể duy trì lợi nhuận, thậm chí còn mất tiền. Đáng chú ý, mô hình Grok của xAI cũng được đề cập là đặc biệt kém hiệu quả trong bối cảnh này.

Khoảng cách giữa lý thuyết và thực tế

Báo cáo này làm nổi bật sự chênh lệch rõ rệt giữa khả năng ngày càng tiến bộ của AI trong một số nhiệm vụ cụ thể (như viết phần mềm hay lập trình) và những thiếu sót của chúng trong các loại vấn đề phức tạp khác của con người.

Việc thất bại trong việc dự đoán bóng đá, một lĩnh vực phụ thuộc nhiều vào biến động ngẫu nhiên và yếu tố con người, cho thấy rằng AI vẫn còn hạn chế trong việc suy luận và đưa ra quyết định trong các bối cảnh thực tế, hỗn loạn và thay đổi liên tục.

Các mô hình AI của Google, OpenAI và Anthropic thất bại thảm hại khi dự đoán kết quả bóng đá

Thử thách "KellyBench" và kết quả bất ngờ

Khoảng cách giữa lý thuyết và thực tế

Bài viết liên quan