Tối ưu hóa đầu tư AI: Biến động lượng công nghệ thành giá trị thực tế cho doanh nghiệp

AI doanh nghiệp đang bước sang giai đoạn "Day 2" với trọng tâm chuyển từ việc xây dựng sang hiệu quả đầu tư. Bài viết phân tích về sự gia tăng chi phí GPU, nghịch lý giữa chi phí giảm và sử dụng tăng, cùng chiến lược chuyển từ người mua sang người tự chủ tạo token.

AI doanh nghiệp đang bước vào một giai đoạn phát triển mới — nơi câu hỏi trung tâm không còn là "chúng ta có thể xây dựng được gì?" mà chuyển sang "làm sao để tận dụng tối đa đầu tư AI?".

Tại buổi thảo luận gần đây của VentureBeat, Brian Gracely, Giám đốc Chiến lược Danh mục đầu tư tại Red Hat, đã mô tả bức tranh thực tế trong các tổ chức lớn: sự phát triển tràn lan của AI, chi phí suy luận (inference costs) ngày càng tăng và tầm nhìn hạn chế về những gì các khoản đầu tư đó thực sự mang lại.

Đây là thời điểm "Day 2" — khi các dự án thí điểm chuyển sang môi trường sản xuất thực tế, và các vấn đề về chi phí, quản trị cũng như tính bền vững trở nên khó khăn hơn cả việc xây dựng hệ thống ban đầu.

"Chúng tôi đã gặp những khách hàng nói rằng: 'Tôi có 50.000 giấy phép Copilot. Tôi không thực sự biết mọi người đang đạt được gì từ đó. Nhưng tôi biết rằng mình đang trả tiền cho loại hình máy tính đắt đỏ nhất thế giới, đó là GPU'. Vậy làm sao tôi có thể kiểm soát việc này?", Gracely chia sẻ.

Tại sao chi phí AI trở thành vấn đề cấp chiến lược

Trong suốt hai năm qua, chi phí không phải là mối lo ngại hàng đầu của các tổ chức khi đánh giá AI tạo sinh (generative AI). Giai đoạn thử nghiệm cho phép các nhóm chi tiêu tự do, và lời hứa hẹn về tăng năng suất đã biện minh cho các khoản đầu tư mạnh mẽ. Tuy nhiên, động thái này đang thay đổi khi các doanh nghiệp bước sang chu kỳ ngân sách thứ hai và thứ ba với AI. Trọng tâm đã chuyển từ "có thể xây dựng được cái gì?" sang "chúng ta có nhận được đúng những gì mình trả tiền?".

Các doanh nghiệp đã đặt cược lớn vào các dịch vụ AI được quản lý (managed AI services) từ sớm đang tiến hành các đợt xem xét kỹ lưỡng để xem liệu những khoản đầu tư đó có mang lại giá trị đo lường được hay không. Vấn đề không chỉ nằm ở việc tính toán bằng GPU đắt đỏ, mà là do nhiều tổ chức thiếu các công cụ đo lường để kết nối chi tiêu với kết quả đầu ra, khiến việc chứng minh cho việc gia hạn hợp đồng hoặc mở rộng quy mô trở nên gần như không thể.

Sự chuyển dịch chiến lược: Từ người tiêu dùng token sang người sản xuất token

Mô hình thu mua AI phổ biến trong vài năm qua rất đơn giản: trả tiền cho nhà cung cấp theo từng token, theo từng người dùng (seat) hoặc theo lệnh gọi API, và để người khác quản lý hạ tầng. Mô hình này có ý nghĩa như một bước khởi đầu, nhưng ngày càng bị các tổ chức đã có đủ kinh nghiệm so sánh các phương án thay thế đặt câu hỏi.

Các doanh nghiệp đã trải qua một chu kỳ AI bắt đầu suy nghĩ lại về mô hình này.

"Thay vì chỉ thuần túy là người tiêu dùng token, làm thế nào để tôi bắt đầu trở thành người tạo token?", Gracely đặt vấn đề. "Có những trường hợp sử dụng và khối lượng công việc nào phù hợp để tôi sở hữu nhiều hơn không? Điều đó có thể có nghĩa là tự vận hành GPU, hoặc thuê GPU. Và sau đó tự hỏi: 'Liệu khối lượng công việc đó có cần mô hình tiên tiến nhất không, hay có các mô hình mã nguồn mở hoặc mô hình nhỏ hơn phù hợp hơn không?'".

Quyết định này không phải là nhị nguyên. Câu trả lời đúng phụ thuộc vào khối lượng công việc, tổ chức và mức độ chấp nhận rủi ro liên quan, nhưng phép toán đang ngày càng phức tạp hơn khi số lượng các mô hình mã nguồn mở mạnh mẽ, từ DeepSeek đến các mô hình hiện có trên các chợ đám mây (cloud marketplaces), ngày càng nhiều. Giờ đây, các doanh nghiệp thực sự có những lựa chọn thay thế thực sự so với số ít nhà cung cấp thống trị cảnh quan cách đây hai năm.

Nghịch lý: Chi phí AI giảm nhưng sử dụng tăng tạo ra bài toán ngân sách

Một số lãnh đạo doanh nghiệp lập luận rằng việc cam kết đầu tư vào hạ tầng ngay lúc này có thể đồng nghĩa với việc trả giá quá cao trong dài hạn, dẫn chứng phát biểu của CEO Anthropic Dario Amodei rằng chi phí suy luận AI đang giảm khoảng 60% mỗi năm.

Sự xuất hiện của các mô hình mã nguồn mở như DeepSeek và các mô hình khác đã mở rộng đáng kể các lựa chọn chiến lược cho các doanh nghiệp sẵn sàng đầu tư vào hạ tầng cơ bản trong ba năm qua.

Tuy nhiên, trong khi chi phí trên mỗi token đang giảm, mức độ sử dụng lại tăng tốc với tốc độ bù đắp hơn mức hiệu quả đạt được. Đây là một phiên bản của Nghịch lý Jevons, nguyên lý kinh tế cho thấy việc cải thiện hiệu quả sử dụng tài nguyên có xu hướng làm tăng tổng mức tiêu thụ thay vì giảm nó, vì chi phí thấp hơn cho phép việc áp dụng rộng rãi hơn.

Đối với các nhà lập kế hoạch ngân sách doanh nghiệp, điều này có nghĩa là chi phí đơn vị giảm không chuyển hóa thành tổng hóa đơn giảm. Một tổ chức tăng gấp ba lần việc sử dụng AI trong khi chi phí giảm một nửa vẫn sẽ chi nhiều tiền hơn so với trước đây. Vấn đề trở nên là: khối lượng công việc nào thực sự cần các mô hình đắt đỏ và mạnh mẽ nhất, và khối lượng nào có thể được xử lý tốt bởi các giải pháp thay thế nhỏ hơn, rẻ hơn?

Lý do kinh doanh để đầu tư vào sự linh hoạt của hạ tầng AI

Giải pháp không phải là làm chậm đầu tư AI, mà là xây dựng với sự linh hoạt là ưu tiên hàng đầu. Những tổ chức sẽ chiến thắng không nhất thiết là những người di chuyển nhanh nhất hoặc chi tiêu nhiều nhất, mà là những người xây dựng hạ tầng và mô hình vận hành có khả năng hấp thụ những phát triển bất ngờ tiếp theo.

"Bạn càng xây dựng được nhiều sự trừu tượng hóa (abstractions) và tạo cho mình sự linh hoạt, bạn càng có thể thử nghiệm mà không bị đội chi phí lên, nhưng cũng không gây nguy hiểm cho doanh nghiệp của mình. Những điều đó quan trọng ngang ngửa với việc hỏi liệu bạn có đang làm mọi việc theo đúng phương pháp hay không ngay lúc này", Gracely giải thích.

Tuy nhiên, mặc dù các cuộc thảo luận về AI đã ăn sâu vào chu kỳ kế hoạch của doanh nghiệp, kinh nghiệm thực tế mà hầu hết các tổ chức có được vẫn chỉ tính bằng năm, không phải bằng thập kỷ.

"Cảm giác như chúng ta đã làm việc này mãi mãi. Nhưng thực tế chúng ta mới chỉ làm việc này trong ba năm", Gracely bổ sung. "Vẫn còn rất sớm và mọi thứ di chuyển rất nhanh. Bạn không biết điều gì sẽ đến tiếp theo. Nhưng bạn nên có một chút dự cảm về đặc điểm của những gì sắp tới".

Đối với các lãnh đạo doanh nghiệp đang hiệu chỉnh chiến lược đầu tư AI, đó có thể là bài học thực tế nhất: Mục tiêu không phải là tối ưu hóa cho cấu trúc chi phí của ngày hôm nay, mà là xây dựng sự linh hoạt về mặt tổ chức và kỹ thuật để thích ứng khi — chứ không phải nếu — mọi thứ thay đổi một lần nữa.