Kỷ nguyên miễn phí của AI đang khép lại: Người dùng và doanh nghiệp đối mặt với cú sốc chi phí

Các phòng thí nghiệm AI hàng đầu như Anthropic và OpenAI đang áp đặt các giới hạn sử dụng và tăng giá để đối phó với áp lực tài chính khổng lồ. Sau giai đoạn đốt tiền để xây dựng cơ sở hạ tầng, ngành công nghiệp AI buộc phải chuyển sang mô hình sinh lời, khiến người dùng cuối phải chịu chi phí cao hơn.

Đầu tháng này, hàng triệu người dùng của OpenClaw đã nhận được một tin sốc: công cụ tác nhân AI (AI agent) từng gây bão trong năm nay đã bị Anthropic áp đặt các hạn chế nghiêm ngặt.

Anthropic, giống như các phòng thí nghiệm AI hàng đầu khác, đang chịu áp lực khổng lồ phải giảm tải cho hệ thống và bắt đầu tạo lợi nhuận. Do đó, nếu người dùng muốn AI Claude tiếp tục hỗ trợ các tác nhân phổ biến của họ, họ sẽ phải trả một cái giá không hề rẻ.

Minh họa áp lực tài chính lên các công ty AI

“Các gói đăng ký của chúng tôi không được xây dựng cho mô hình sử dụng của các công cụ bên thứ ba này,” Boris Cherny, người đứng đầu mảng Claude Code, viết trên X. “Chúng tôi muốn có chủ đích trong việc quản lý tăng trưởng để tiếp tục phục vụ khách hàng một cách bền vững trong dài hạn. Thay đổi này là một bước đi hướng tới mục tiêu đó.”

Thông báo này là một dấu hiệu của thời đại. Các nhà đầu tư đã đổ hàng trăm tỷ USD vào các công ty như OpenAI và Anthropic để giúp họ mở rộng quy mô và xây dựng năng lực tính toán. Giờ đây, họ đang mong đợi khoản đầu tư sinh lời. Sau nhiều năm cung cấp quyền truy cập rẻ hoặc thậm chí miễn phí vào các hệ thống AI tiên tiến, hóa đơn bắt đầu đến hạn — và người dùng ở hạ nguồn đang bắt đầu cảm thấy sự thắt chặt.

Áp lực sinh lợi từ các nhà đầu tư

Trong vài năm qua, hầu hết các phòng thí nghiệm AI hàng đầu đều đã giới thiệu các cấp đăng ký mới để thu hút người dùng chuyên nghiệp. OpenAI và Anthropic đã thay đổi kế hoạch giá cho khách hàng doanh nghiệp. OpenAI thậm chí đã đưa quảng cáo vào nền tảng. Tất cả đều là những nỗ lực nhằm tìm kiếm dòng tiền.

Theo một cách nào đó, đây là một câu chuyện cũ kỹ, đặc biệt là sự phản chiếu rõ ràng của bùng nổ công nghệ những năm 2010. Các nhà đầu tư mạo hiểm đã giúp các startup trợ cấp cho sự tăng trưởng nhanh chóng trong tất cả các lĩnh vực: ứng dụng gọi xe, thương mại điện tử, giao đồ ăn và tạp hóa. Một khi các công ty củng cố quyền lực của mình, họ tăng giá, thêm các nguồn doanh thu mới và mang lại lợi nhuận cho nhà đầu tư. Hoặc họ không làm được — và họ phá sản.

Tuy nhiên, các công ty AI đã đốt tiền của nhà đầu tư với tốc độ nhanh hơn bất kỳ lĩnh vực nào trong lịch sử gần đây. Họ đã khởi công các trung tâm dữ liệu trên khắp thế giới, cam kết hàng tỷ USD với lời hứa về các mô hình tốt hơn, chi phí thấp hơn và AI cho tất cả mọi người. Ngay cả việc ngăn chặn dòng thua lỗ cũng là một nhiệm vụ khó khăn — chưa nói đến việc kiếm được loại tiền mà các nhà đầu tư đang hy vọng.

“Khi bạn bỏ hàng nghìn tỷ USD vào trung tâm dữ liệu, bạn sẽ mong đợi một khoản lợi nhuận,” Will Sommer, giám đốc phân tích cấp cao tại Gartner, chuyên về dự báo kinh tế và mô hình định lượng, cho biết.

Nghịch lý Stegosaurus và cuộc đua token

Gartner ước tính rằng giữa năm 2024 và 2029, vốn đầu tư vào các trung tâm dữ liệu AI sẽ đạt khoảng 6,3 nghìn tỷ USD — một “con số khổng lồ”. Để tránh việc ghi giảm giá trị tài sản này, các nhà cung cấp mô hình AI lớn lý tưởng nhất phải tạo ra lợi nhuận trên vốn đầu tư (ROIC) khoảng 25%.

Để đạt được mức tối thiểu 7% chỉ để không bị lỗ, Gartner dự báo rằng các công ty AI lớn sẽ cần kiếm được tổng cộng gần 7 nghìn tỷ USD doanh thu driven bởi AI thông qua năm 2029.

Vậy các nhà cung cấp mô hình như OpenAI kiếm tiền từ đâu? Bằng cách bán quyền truy cập vào cái gọi là token. Một token về cơ bản là một đơn vị dữ liệu đầu vào mà mô hình AI có thể hiểu và xử lý — có thể là văn bản, hình ảnh, âm thanh hoặc thứ gì khác. Để đáp ứng kỳ vọng doanh thu của nhà đầu tư, các nhà cung cấp sẽ cần xử lý một số lượng token “đáng kinh ngạc”.

Hiện tại, Google thông báo họ đang xử lý 1,3 quadrillion token vào tháng 10. Nhưng để đạt được mức chi tiêu 2 nghìn tỷ USD mỗi năm mà Gartner tính toán, các nhà cung cấp sẽ cần tạo ra tích lũy 10 sextillion token mỗi năm. Ngay cả khi giả định biên lợi nhuận hào phóng là 10% cho mỗi token, điều đó sẽ có nghĩa là mức tiêu thụ token từ nay đến năm 2030 sẽ cần phải tăng gấp 50.000–100.000 lần.

Sự trỗi dậy của AI Agent và chi phí suy luận

Trong những ngày đầu của AI, phần lớn chi phí tính toán dành cho việc đào tạo các mô hình ban đầu, trong khi suy luận (inference — hoặc thực hiện nhiệm vụ) rẻ hơn. Tuy nhiên, khi các mô hình phát triển và hệ thống thêm tính năng, suy luận trở nên tốn kém tài nguyên hơn nhiều.

Các tác nhân AI (AI agents), hay những công cụ có thể hoàn thành các nhiệm vụ đa bước phức tạp thay mặt bạn, hiện tiêu thụ nhiều token hơn rất nhiều so với các mô hình chatbot cơ bản vài năm trước. Các mô hình lý luận (reasoning models), ngày càng cung cấp năng lực cho các tác nhân AI, cũng nổi tiếng là tốn kém về mặt suy luận.

“Bạn nhập một câu lệnh ngắn… và nó sẽ tự nói với mình hàng nghìn, hàng vạn token, có thể lên đến hàng chục nghìn khi bạn lập trình,” Mark Riedl, giáo sư tại Trường Khoa học Máy tính Tương tác của Georgia Tech, giải thích. “Nếu bạn có hàng nghìn hoặc hàng triệu người sử dụng những thứ này mỗi ngày, chi phí suy luận chỉ từ việc người dùng tạo ra hàng tấn token thực sự vượt trội so với chi phí đào tạo.”

Người dùng và doanh nghiệp phản ứng thế nào?

Các phòng thí nghiệm AI hàng đầu gần đây đã thay đổi chính sách sử dụng API và công cụ bên thứ ba — giống như việc Anthropic về cơ bản cấm sử dụng OpenClaw trừ khi người đăng ký trả thêm phí — do áp lực quá tải.

Đối với các công ty xây dựng công cụ dựa trên các mô hình như GPT-5 hoặc Claude Opus, giá token đang tăng lên, và chi phí thêm này phần lớn được chuyển xuống cho khách hàng của họ. Nhiều công ty công nghệ cho biết họ hoặc khách hàng của mình đang thay đổi chiến lược để bù đắp cho định giá mới. Một số đang cân nhắc chuyển sang các mô hình mã nguồn mở hoàn toàn hoặc một phần.

David DeSanto, CEO của công ty phần mềm Anaconda, cho biết nhiều khách hàng đang chuyển sang tự lưu trữ các mô hình AI hoặc chuyển sang các mô hình mã nguồn mở vì chúng đã cải thiện đáng kể trên các điểm chuẩn gần đây.

“Mọi người tôi nói chuyện đều có một phiên bản nào đó của vấn đề này — việc sử dụng token của họ đã tăng lên, vì vậy chi phí tính phí dựa trên mức sử dụng của họ cũng tăng lên,” DeSanto nói.

Eve, một công ty bán phần mềm cho luật sư nguyên đơn, luôn cân bằng giữa chất lượng và chi phí token. Jay Madheswaran, đồng sáng lập Eve, cho biết việc sử dụng token của họ đã tăng gấp 100 lần so với cùng kỳ năm ngoái. Công ty thường thấy mình sử dụng các mô hình lý luận mới hơn, đắt đỏ hơn khoảng 25–30% thời gian, và chia sẻ phần còn lại giữa các biến thể mã nguồn mở của riêng Eve và các mô hình nhỏ hơn, rẻ hơn.

“Mã nguồn mở thực sự đang gây áp lực lên các công ty này để làm cho các mô hình rẻ hơn của họ rẻ hơn,” Madheswaran nói.

Tương lai của thị trường AI

Box’s Levie tin rằng những thay đổi này sẽ diễn ra trong 24 tháng tới. Ông cho rằng kỷ nguyên AI được trợ cấp bởi vốn mạo hiểm có lẽ là cần thiết cho sự tăng trưởng, nhưng giờ là lúc xây dựng hiệu quả hơn vào hệ thống, và không phải ai cũng sống sót qua được nó.

Gartner’s Sommer so sánh toàn bộ kịch bản với cái ông gọi là “nghịch lý Stegosaurus”. Khi các nhà khoa học lần đầu tiên phát hiện ra hóa thạch khủng long Stegosaurus, họ không hiểu làm thế nào một cơ thể lớn có thể được hỗ trợ bởi một cái đầu nhỏ với cái miệng tí hon — và lý thuyết họ phát triển là con Stegosaurus sẽ cần phải liên tục ăn, và ăn một chế độ ăn uống rất bổ dưỡng.

“Chúng tôi thấy AI cũng giống như vậy,” Sommer nói — để con Stegosaurus (các phòng thí nghiệm AI) tồn tại, thì các nhà cung cấp cần tìm thêm thức ăn cho nó (toàn bộ nền kinh tế toàn cầu, không chỉ là thị trường công nghệ) và nó cũng phải rất bổ dưỡng (tức là các nhà cung cấp cần có thể kiếm được biên lợi nhuận từ nó và ngừng trợ cấp).

Nếu nghịch lý Stegosaurus không được giải quyết, nó sẽ dẫn đến việc ghi giảm giá trị, định giá giảm, tài chính cạn kiệt và sự thiết lập lại kỳ vọng trên toàn thế giới đối với AI.

“Kỷ nguyên miễn phí thực sự là một cuộc chiếm đất — đó là một chiến lược phổ biến được sử dụng bởi các startup,” Madheswaran của Eve nói. “Đó thực sự không phải là một mô hình kinh doanh. Bạn không thể làm điều đó quá lâu.”