Microsoft và các ông lớn công nghệ đối mặt với nghịch lý: Chi phí AI đắt đỏ hơn nhân viên thực tế

Các công ty công nghệ đang thúc đẩy nhân viên sử dụng AI tối đa, nhưng thực tế cho thấy chi phí tính toán đang trở nên quá đắt đỏ. Microsoft và Uber đã phải cắt giảm ngân sách hoặc hủy bỏ các công cụ AI phổ biến vì chi phí vượt mức dự kiến, đặt ra câu hỏi lớn về hiệu quả kinh tế của việc thay thế con người bằng AI.

Các doanh nghiệp hiện nay đang không ngừng thúc đẩy nhân viên sử dụng trí tuệ nhân tạo (AI) tối đa để khai thác lợi ích về năng suất mà công nghệ này mang lại. Tuy nhiên, áp lực này đang dẫn đến những rạn nứt, và những rạn nứt đó có thể không thể khắc phục được.

Theo báo cáo từ The Verge, Microsoft đã bắt đầu hủy bỏ phần lớn giấy phép sử dụng trực tiếp công cụ Claude Code, thay vào đó chuyển hướng các kỹ sư sang sử dụng GitHub Copilot CLI. Quyết định này được đưa ra chỉ sau sáu tháng kể từ khi công ty mở quyền truy cập Claude Code, khuyến khích hàng nghìn lập trình viên, quản lý dự án, nhà thiết kế và nhân viên khác thử nghiệm công cụ viết mã này.

Công nghệ này trở nên phổ biến rất nhanh. Có lẽ là quá nhanh. Quy mô sử dụng của nhân viên hiện nay đang khiến Microsoft phải đảo ngược chiến lược đối với một công cụ mà chính các kỹ sư của họ đã phụ thuộc vào. Việc hủy giấy phép Claude Code sẽ không ảnh hưởng đến thỏa thuận Foundry của Microsoft, bao gồm khoản đầu tư lên tới 5 tỷ USD vào Anthropic và việc cung cấp quyền truy cập các mô hình Claude cho khách hàng Foundry, cũng như cam kết 30 tỷ USD của Anthropic để mua sức mạnh tính toán Azure.

Microsoft không phải là công ty duy nhất cắt giảm việc sử dụng AI nội bộ. Tháng 4 năm nay, Giám đốc công nghệ (CTO) của Uber, Praveen Neppalli Naga, cho biết The Information rằng công ty đã "đốt sạch" toàn bộ ngân sách năm 2026 cho các công cụ lập trình AI chỉ trong bốn tháng. Điều này xảy ra sau khi công ty tích cực khuyến khích việc áp dụng thông qua các bảng xếp hạng nội bộ xếp hạng các đội nhóm theo mức độ sử dụng công cụ AI.

Những báo cáo này có thể làm nguội lạnh các cược mà các công ty công nghệ lớn nhất đặt vào công nghệ này. Trong khi một số người vẫn bám vào lời hứa hẹn về một "kỷ nguyên phục hưng" hay "cuộc cách mạng" AI, chi phí áp dụng đang chứng minh là một nút thắt khó gỡ. Những phát triển này cũng cho thấy kinh tế học của việc thay thế hoặc bổ sung lao động con người bằng AI có thể phức tạp hơn nhiều so với một số dự báo ban đầu.

Điều này dường như lặp lại nhận định gần đây của Bryan Catanzaro, phó chủ tịch áp dụng học sâu (applied deep learning) tại Nvidia, trong một cuộc phỏng vấn với Axios.

"Đối với đội của tôi, chi phí tính toán cao hơn nhiều so với chi phí nhân viên", ông nói.

Anthropic và Microsoft từ chối bình luận về vấn đề này.

Nghịch lý AI đang nổi lên: Token rẻ hơn, hóa đơn lớn hơn

Uber và Microsoft không phải là những công ty duy nhất thúc đẩy nhân viên sử dụng AI nhiều nhất có thể. Tương tự như tại Uber, một nhân viên Meta đã tạo ra một bảng xếp hạng, đặt tên phù hợp là "Claudeonomics" (theo mô hình AI của Anthropic), để theo dõi nhân viên nào đang sử dụng nhiều AI nhất. Amazon cũng đang thúc đẩy nhân viên thực hiện "toxenmaxx", hay nói cách khác là sử dụng càng nhiều token AI càng tốt (token là các khối xây dựng cơ bản của tính toán AI).

Tuy nhiên, với hệ thống định giá dựa trên token, công việc trở nên đắt đỏ hơn khi sử dụng nhiều hơn và hiệu quả hơn. Goldman Sachs gần đây dự báo rằng AI tác nhân (agentic AI) có thể thúc đẩy mức tiêu thụ token tăng gấp 24 lần vào năm 2030 khi người tiêu dùng và doanh nghiệp áp dụng các tác nhân AI, đạt mức đáng kinh ngạc 120 nghìn tỷ tỷ token mỗi tháng. Khi các doanh nghiệp chuyển sang các tác nhân AI để tăng năng suất, tổng chi phí có thể tăng mạnh ngay cả khi giá của mỗi token giảm.

Mặc dù mức tiêu thụ tăng, chi phí của từng token AI dự kiến sẽ giảm mạnh. Một báo cáo gần đây của công ty nghiên cứu Gartner cho thấy đến năm 2030, chi phí suy luận (inference) trên một mô hình ngôn ngữ lớn (LLM) có một nghìn tỷ tham số — nói một cách đơn giản là một mô hình AI rất tinh vi — sẽ rẻ hơn gần 90% so với năm 2025 đối với các công ty AI.

Tuy nhiên, Gartner dự đoán rằng token rẻ hơn không đồng nghĩa với việc AI doanh nghiệp sẽ rẻ hơn, bởi vì các mô hình tác nhân cần nhiều token hơn nhiều cho mỗi nhiệm vụ so với các mô hình tiêu chuẩn, mức tiêu thụ tăng có thể vượt qua tốc độ giảm chi phí đơn vị, và các nhà cung cấp AI sẽ không chuyển hết chi phí thấp hơn cho người tiêu dùng. Do đó, chi phí suy luận có xu hướng sẽ tăng cao.

"Các Giám đốc sản phẩm (CPO) không nên nhầm lẫn sự giảm phát của token hàng hóa với sự dân chủ hóa của lý luận tiên tiến", Will Sommer, giám đốc phân tích cao cấp tại Gartner, cảnh báo trong một tuyên bố.

Thực tế này có thể làm phức tạp các kế hoạch lớn mà một số công ty đang triển khai cho các tác nhân AI. Giám đốc điều hành Nvidia, Jensen Huang, gần đây nói rằng ông nghĩ rằng một ngày nào đó sẽ có 100 tác nhân AI làm việc cùng mỗi nhân viên trong công ty mình.

Ông Huang là một phần của làn sóng các CEO rộng lớn hơn đang tán dương một tương lai với các tác nhân, nơi những người lao động kỹ thuật số hoạt động trên khắp doanh nghiệp. Nhưng nếu mức tiêu thụ token tăng nhanh hơn tốc độ giảm chi phí đơn vị, tương lai đó có thể đi kèm với một cái giá đắt hơn nhiều so với gì các giám đốc điều hành mong đợi.

Microsoft và các ông lớn công nghệ đối mặt với nghịch lý: Chi phí AI đắt đỏ hơn nhân viên thực tế

Bài viết liên quan