Báo cáo Chỉ số AI 2026 của Stanford: Bức tranh toàn cảnh về cuộc đua công nghệ nhân tạo

Báo cáo Chỉ số AI 2026 của Stanford vừa công bố đã cắt đứt sự ồn ào giữa các luồng thông tin trái chiều về bong bóng hay cơn sốt AI. Nó chỉ ra rằng các mô hình hàng đầu ngày càng hoàn thiện, tốc độ chấp nhận nhanh hơn PC hay Internet, nhưng đi kèm với chi phí năng lượng khổng lồ và thách thức về pháp lý.

Nếu bạn thường xuyên theo dõi tin tức công nghệ, chắc hẳn bạn đang cảm thấy chóng mặt vì những thông tin trái chiều về AI. Có lúc AI được ví như một cơn sốt vàng, lúc lại bị coi là bong bóng, hoặc vừa bị cáo buộc cướp việc làm vừa bị chê không biết xem đồng hồ.

Báo cáo Chỉ số AI 2026 (AI Index) từ Viện Trí tuệ Nhân tạo Hướng về Con người của Đại học Stanford vừa được công bố hôm nay, đóng vai trò như một "phiếu điểm" hàng năm giúp làm rõ bức tranh này. Mặc dù có nhiều dự đoán rằng sự phát triển AI sẽ chững lại, báo cáo khẳng định các mô hình hàng đầu vẫn tiếp tục hoàn thiện. Người dùng đang tiếp nhận AI nhanh hơn cả máy tính cá nhân hay Internet. Các công ty AI đang tạo ra doanh thu nhanh hơn bất kỳ làn sóng công nghệ nào trước đây, nhưng họ cũng đang chi hàng trăm tỷ USD cho trung tâm dữ liệu và chip.

Biểu đồ so sánh hiệu suất AI

Tuy nhiên, tốc độ phát triển này đi kèm cái giá đắt. Các trung tâm dữ liệu AI trên toàn cầu hiện nay có thể tiêu thụ tới 29,6 gigawatts điện năng, đủ để cung cấp cho toàn bộ bang New York vào thời điểm nhu cầu cao điểm. Lượng nước sử dụng hàng năm chỉ để vận hành mô hình GPT-4o của OpenAI có thể vượt quá nhu cầu nước uống của 12 triệu người. Đồng thời, chuỗi cung ứng chip đang ở mức báo động mong manh khi Mỹ lưu trữ phần lớn trung tâm dữ liệu AI thế giới, còn một công ty tại Đài Loan là TSMC sản xuất gần như mọi chip AI hàng đầu.

Dưới đây là những điểm chính từ báo cáo năm nay.

Mỹ và Trung Quốc đang ngang tài ngang sức

Trong một cuộc đua dài với lợi ích địa chính trị khổng lồ, Mỹ và Trung Quốc gần như ngang nhau về hiệu suất mô hình AI, theo dữ liệu từ Arena - một nền tảng xếp hạng do cộng đồng điều hành. Đầu năm 2023, OpenAI đã dẫn đầu với ChatGPT, nhưng khoảng cách này đã thu hẹp trong năm 2024 khi Google và Anthropic tung ra các mô hình của riêng họ. Vào tháng 2 năm 2025, R1 - một mô hình AI do phòng thí nghiệm Trung Quốc DeepSeek xây dựng - đã briefly san bằng mức với mô hình hàng đầu của Mỹ là ChatGPT. Tính đến tháng 3 năm 2026, Anthropic dẫn đầu, theo sát bởi xAI, Google và OpenAI. Các mô hình Trung Quốc như DeepSeek và Alibaba chỉ tụt lại một chút.

So sánh Mỹ và Trung Quốc

Báo cáo lưu ý rằng Mỹ và Trung Quốc có những lợi thế AI khác nhau. Trong khi Mỹ có các mô hình AI mạnh mẽ hơn, nhiều vốn hơn và ước tính khoảng 5.427 trung tâm dữ liệu (gấp hơn 10 lần bất kỳ quốc gia nào khác), thì Trung Quốc lại dẫn đầu về các công bố nghiên cứu AI, bằng sáng chế và robot học.

Khi cạnh tranh ngày càng khốc liệt, các công ty như OpenAI, Anthropic và Google không còn công bố mã đào tạo, số lượng tham số hay kích thước bộ dữ liệu nữa.

"Chúng ta không biết nhiều điều về việc dự đoán hành vi của mô hình," - Yolanda Gil, nhà khoa học máy tính tại Đại học Nam California và đồng tác giả báo cáo, cho biết. Sự thiếu minh bạch này khiến các nhà nghiên cứu độc lập khó khăn trong việc nghiên cứu cách làm cho mô hình AI an toàn hơn.

Các mô hình AI đang tiến bộ siêu nhanh

Mặc dù có dự đoán rằng sự phát triển sẽ đi vào ngõ cụt, các mô hình AI vẫn tiếp tục trở nên tốt hơn. Theo một số đo lường, chúng hiện đã đáp ứng hoặc vượt qua hiệu suất của các chuyên gia con người trong các bài kiểm tra nhằm đo lường sự hiểu biết về khoa học, toán học và ngôn ngữ ở trình độ tiến sĩ. SWE-bench Verified, một bài chuẩn kỹ thuật phần mềm cho các mô hình AI, đã thấy điểm số cao nhất nhảy vọt từ khoảng 60% vào năm 2024 lên gần 100% vào năm 2025. Vào năm 2025, một hệ thống AI đã tự tạo ra một dự báo thời tiết.

"Tôi thực sự ngạc nhiên vì công nghệ này tiếp tục cải thiện và hoàn toàn không có dấu hiệu chững lại," - Gil nói.

Tuy nhiên, AI vẫn gặp khó khăn trong nhiều lĩnh vực khác. Vì các mô hình học bằng cách xử lý lượng văn bản và hình ảnh khổng lồ thay vì trải nghiệm thế giới vật lý, AI thể hiện "trí thông minh không đồng đều". Robot vẫn còn ở giai đoạn sơ khai và chỉ hoàn thành thành công 12% nhiệm vụ hộ gia đình. Xe tự lái phát triển hơn: xe Waymo hiện đang lăn bánh ở năm thành phố của Mỹ, và xe Apollo Go của Baidu đang chở khách ở Trung Quốc. AI cũng đang mở rộng sang các lĩnh vực chuyên nghiệp như luật và tài chính, nhưng chưa có mô hình nào thống trị lĩnh vực này.

Nhưng cách chúng ta kiểm tra AI đã bị lỗi thời

Những báo cáo về tiến bộ này nên được tiếp nhận với một chút hoài nghi. Các bài chuẩn (benchmark) được thiết kế để theo dõi tiến bộ của AI đang gặp khó khăn trong việc bắt kịp khi các mô hình nhanh chóng phá vỡ trần của chúng, báo cáo của Stanford cho biết. Một số bài chuẩn được xây dựng kém - một bài chuẩn phổ biến kiểm tra khả năng toán học của mô hình có tỷ lệ lỗi 42%. Những bài khác có thể bị "lách luật": khi các mô hình được đào tạo trên dữ liệu kiểm tra, chúng có thể học cách ghi điểm cao mà không thực sự thông minh hơn.

Vì AI hiếm khi được sử dụng theo cách giống như khi nó được kiểm tra, hiệu suất bài chuẩn mạnh không luôn chuyển hóa thành hiệu suất thực tế. Và đối với các công nghệ phức tạp, tương tác như tác nhân AI và robot, các bài chuẩn hầu như chưa tồn tại.

Các công ty AI cũng đang chia sẻ ít hơn về cách đào tạo các mô hình của họ, và kiểm tra độc lập đôi khi kể một câu chuyện khác với những gì họ báo cáo.

"Nhiều công ty không công bố cách mô hình của họ hoạt động trong các bài chuẩn nhất định, đặc biệt là các bài chuẩn về AI có trách nhiệm," - Gil nói. "Sự vắng mặt của việc mô hình của bạn hoạt động như thế nào trên một bài chuẩn có thể nói lên điều gì đó."

AI đang bắt đầu ảnh hưởng đến việc làm

Trong vòng ba năm kể từ khi trở thành xu hướng chủ đạo, AI hiện đã được hơn một nửa người dân trên thế giới sử dụng, với tốc độ chấp nhận nhanh hơn máy tính cá nhân hay Internet. Ước tính 88% tổ chức hiện sử dụng AI, và 4 trong 5 sinh viên đại học sử dụng nó.

Đây vẫn là những ngày đầu triển khai, và tác động của AI đến việc làm khó có thể đo lường chính xác. Tuy nhiên, một số nghiên cứu cho thấy AI đang bắt đầu ảnh hưởng đến người lao động trẻ trong một số nghề nhất định. Theo một nghiên cứu năm 2025 của các nhà kinh tế tại Stanford, việc làm cho các nhà phát triển phần mềm từ 22 đến 25 tuổi đã giảm gần 20% kể từ năm 2022. Sự sụt giảm này có thể không chỉ do AI gây ra, vì các điều kiện kinh tế vĩ mô rộng lớn hơn cũng có thể là nguyên nhân, nhưng AI dường như đang đóng một phần.

Các nhà tuyển dụng cho biết việc tuyển dụng có thể sẽ tiếp tục siết chặt. Theo một cuộc khảo sát năm 2025 của McKinsey & Company, một phần ba các tổ chức kỳ vọng AI sẽ làm giảm lực lượng lao động của họ trong năm tới, đặc biệt là trong vận hành dịch vụ, chuỗi cung ứng và kỹ thuật phần mềm. AI đang tăng năng suất lên 14% trong dịch vụ khách hàng và 26% trong phát triển phần mềm, theo nghiên cứu được trích dẫn trong chỉ số, nhưng những lợi ích này không được thấy trong các nhiệm vụ đòi hỏi sự phán xét nhiều hơn. Nhìn chung, vẫn còn quá sớm để hiểu tác động kinh tế rộng lớn hơn của AI.

Mọi người có cảm xúc phức tạp về AI

Trên toàn thế giới, mọi người cảm thấy vừa lạc quan vừa lo lắng về AI: 59% người nghĩ rằng nó sẽ mang lại nhiều lợi ích hơn bất lợi, trong khi 52% nói rằng nó khiến họ lo lắng, theo một cuộc khảo sát của Ipsos được trích dẫn trong chỉ số.

Đáng chú ý, các chuyên gia và công chúng nhìn nhận tương lai của AI rất khác nhau, theo một cuộc khảo sát của Pew. Khoảng cách lớn nhất là về tương lai của công việc: Trong khi 73% chuyên gia nghĩ rằng AI sẽ có tác động tích cực đến cách mọi người làm việc, chỉ có 23% công chúng Mỹ nghĩ như vậy. Các chuyên gia cũng lạc quan hơn công chúng về tác động của AI đối với giáo dục và chăm sóc y tế, nhưng họ đồng ý rằng AI sẽ gây hại cho các cuộc bầu cử và các mối quan hệ cá nhân.

Trong số tất cả các quốc gia được khảo sát, người Mỹ tin tưởng chính phủ của họ ít nhất để điều chỉnh AI một cách phù hợp, theo một cuộc khảo sát Ipsos khác. Nhiều người Mỹ lo ngại rằng quy định liên bang về AI sẽ không đi đủ xa hơn là lo ngại nó sẽ đi quá xa.

Các chính phủ đang gặp khó khăn trong việc điều chỉnh AI

Các chính phủ trên toàn thế giới đang gặp khó khăn trong việc điều chỉnh AI, nhưng năm ngoái đã có một số thành công nhỏ. Lệnh cấm đầu tiên của Đạo luật AI của EU, cấm sử dụng AI trong cảnh sát dự đoán và nhận diện cảm xúc, đã có hiệu lực. Nhật Bản, Hàn Quốc và Ý cũng thông qua các luật pháp quốc gia về AI. Trong khi đó, chính phủ liên bang Mỹ đã chuyển hướng sang nới lỏng quy định, với Tổng thống Trump ban hành một lệnh hành pháp tìm cách trói tay các bang trong việc điều chỉnh AI.

Mặc dù có hành động liên bang này, các cơ quan lập pháp tiểu bang ở Mỹ đã thông qua kỷ lục 150 dự luật liên quan đến AI. California đã ban hành luật pháp mang tính bước ngoặt, bao gồm SB 53, yêu cầu công bố an toàn và các biện pháp bảo vệ người tố giác cho các nhà phát triển mô hình AI. New York đã thông qua Đạo luật RAISE, yêu cầu các công ty AI công bố các giao thức an toàn và báo cáo các sự cố an toàn nghiêm trọng.

Nhưng với tất cả hoạt động lập pháp này, Gil nói rằng việc điều chỉnh đang tụt hậu so với công nghệ vì chúng ta thực sự không hiểu nó hoạt động như thế nào.

"Các chính phủ thận trọng trong việc điều chỉnh AI vì... chúng ta không hiểu nhiều thứ rất tốt," - cô nói. "Chúng ta không nắm bắt tốt các hệ thống đó."