Kinh tế AI đang vỡ trận: Khi thời đại trợ giá kết thúc và hóa đơn thực tế hiện ra
Quyết định của GitHub Copilot chuyển sang tính phí theo mức sử dụng đã hé lộ sự bền vững kém của mô hình đăng ký AI hiện tại. Các công ty công nghệ lớn đang đối mặt với thực tế khắc nghiệt khi chi phí tính toán khổng lồ vượt xa khả năng chi trả của người dùng và doanh nghiệp.

Kinh tế AI đang vỡ trận: Khi thời đại trợ giá kết thúc và hóa đơn thực tế hiện ra
Sáng hôm qua, người dùng GitHub Copilot đã nhận được xác nhận về một tin tức không thể tránh khỏi: tất cả các gói dịch vụ Copilot sẽ chuyển sang mô hình định giá theo mức sử dụng (usage-based pricing) vào ngày 1 tháng 6 năm 2026. Thay vì giới hạn số lượng "yêu cầu", Microsoft sẽ bắt đầu tính phí dựa trên chi phí thực tế của các mô hình mà người dùng sử dụng.
Minh họa dữ liệu và chi phí
Thông báo này được Microsoft ngụy trang dưới vỏ bọc của sự "tiến hóa" sản phẩm, nhưng thực chất là một lời thú nhận tàn nhẫn: họ không thể tiếp tục trợ giá cho người dùng nữa. Đây là minh chứng rõ ràng nhất cho thấy nền kinh tế của Trí tuệ Nhân tạo (AI) đang vỡ vụn.
Cuộc khủng hoảng AI thứ cấp
Cách đây hai năm, tôi đã dự đoán về một "cuộc khủng hoảng AI thứ cấp" (Subprime AI Crisis), nơi toàn bộ ngành công nghệ công nghệ đã mua vào một công nghệ được bán với giá rẻ mạt, được trợ giá nặng nề bởi các ông lớn công nghệ. Tốc độ đốt tiền khủng khiếp của AI tạo sinh (Generative AI) cuối cùng đã đuổi kịp họ.
Và ngày hôm nay đã đến. Mọi dịch vụ AI mà bạn đang sử dụng đều đang được trợ giá cho chi phí tính toán (compute), và kết quả là mọi dịch vụ đều đang mất tiền.
Theo Wall Street Journal, vào tháng 10 năm 2023, cá nhân trả 10 USD mỗi tháng cho trợ lý AI GitHub Copilot, nhưng Microsoft lại lỗ trung bình hơn 20 USD mỗi tháng cho mỗi người dùng. Một số người dùng tốn đến 80 USD mỗi tháng cho công ty. Đây là một mô hình kinh doanh không thể tồn tại mãi mãi.
Ảo tưởng về mô hình đăng ký tháng
Vấn đề cốt lõi nằm ở chỗ mô hình đăng ký tháng (monthly subscription) hoàn toàn không hợp lý với các dịch vụ sử dụng Mô hình Ngôn ngữ Lớn (LLM).
Hãy tưởng tượng như sau: Nếu Uber tính phí người dùng 20 USD một tháng cho 100 chuyến xe bất kể quãng đường, nhưng giá xăng lại là 150 USD một gallon và Uber phải trả tiền xăng đó. Rốt cuộc, Uber sẽ buộc phải tính thêm phí xăng, và người dùng sẽ từ việc trả 20 USD cố định sẽ phải trả 20 USD tiền truy cập cộng với 26 USD tiền xăng cho một chuyến đi 10 dặm.
Minh họa hạ tầng và máy chủ
Đó chính xác là những gì đang xảy ra với GitHub Copilot và ngành công nghiệp AI. Các công ty đã lừa dối khách hàng bằng cách bán một dịch vụ không bền vững, che giấu chi phí thực tế đằng sau các thuật ngữ khó hiểu như "token" hay "yêu cầu".
Khi chuyển sang tính phí theo token, người dùng sẽ bị sốc khi nhận ra một yêu cầu duy nhất trước đây được coi là "premium" có thể ngốn tới 11 USD chi phí tính toán. Việc mô hình tạo ra mã nguồn bị ảo giác (hallucination) hay sai sót sẽ trở nên khó chấp nhận hơn nhiều khi bạn phải trả tiền trực tiếp cho từng lỗi lầm đó.
Ác mộng chi phí cho doanh nghiệp
Vấn đề này còn nghiêm trọng hơn ở cấp độ doanh nghiệp. Theo ước tính của Anthropic, chi phí trung bình cho một lập trình viên sử dụng Claude Code là khoảng 13 đến 30 USD mỗi ngày. Với 21 ngày làm việc mỗi tháng, con số này lên tới 273 đến 630 USD mỗi tháng cho một người, tương đương 3.276 đến 7.560 USD mỗi năm.
Đối với một đội ngũ 10 người, chi phí token có thể lên tới 75.600 USD mỗi năm, chưa kể những tháng đỉnh điểm có thể vượt xa con số đó. Goldman Sachs thậm chí cho thấy một số công ty đang chi tới 10% ngân sách nhân sự cho các token AI.
"Mọi công ty lớn yêu cầu nhân viên 'sử dụng AI nhiều nhất có thể' đều làm vậy trong khi hoàn toàn phớt lờ chi phí token thực tế."
Các nghiên cứu về ROI (tỷ suất hoàn vốn) của AI đang gặp khó khăn trong việc tìm bằng chứng về hiệu quả thực tế. Nếu bạn chi 10% ngân sách nhân sự cho AI nhưng không thấy lợi nhuận tương ứng, khoản đầu tư đó chỉ là một lỗ hổng tài chính.
Kinh tế Trung tâm dữ liệu (Data Center) không có nghĩa
Cách mọi người nói về trung tâm dữ liệu AI hoàn toàn tách rời khỏi thực tế. Việc xây dựng và vận hành chúng cực kỳ đắt đỏ nhưng mang lại rất ít doanh thu thực tế.
Minh họa tài chính và đầu tư
Chi phí để xây dựng một trung tâm dữ liệu 100MW là khổng lồ: khoảng 30 triệu USD cho phần cứng IT (chủ yếu là GPU) và 14 triệu USD cho mỗi MW công suất. Với chi phí khấu hao 6 năm, lãi suất vay và chi phí vận hành, biên lợi nhuận gộp có thể chỉ vỏn vẹn 5% hoặc thậm chí âm, ngay cả khi có 100% khách hàng thuê bao.
Dự án Stargate Abilene của Oracle dành cho OpenAI là một ví dụ điển hình. Với chi phí ước tính 52,8 tỷ USD, Oracle kỳ vọng kiếm được khoảng 10 tỷ USD doanh thu mỗi năm. Tuy nhiên, toàn bộ dự án này phụ thuộc vào khả năng thanh toán của OpenAI.
Bong bóng AI đang xì hơi
Để có thể trả tiền cho các hợp đồng tính toán khổng lồ này, OpenAI cần huy động hoặc kiếm được 852 tỷ USD trong doanh thu và vốn trong vòng 4 năm tới. Điều này đòi hỏi tăng trưởng hơn 250% mỗi năm và đạt doanh thu ngang bằng Microsoft vào năm 2030.
Đây là những con số phi lý. Giám đốc tài chính Sarah Friar của OpenAI đã bày tỏ lo ngại rằng công ty có thể không đủ khả năng chi trả cho các hợp đồng tính toán trong tương lai nếu doanh thu không tăng trưởng đủ nhanh.
Khi các công ty chuyển sang tính phí theo token thực tế, tôi nghi ngờ chúng ta sẽ không còn thấy sự cường điệu (hype) xung quanh AI tạo sinh như hiện nay. Người dùng và doanh nghiệp sẽ phải đối mặt với cái giá thực sự của công nghệ này, và nó không hề rẻ như những gì chúng ta đã được hứa hẹn trong thời kỳ bong bóng.



