GPT-5.5: Tiết kiệm token nhưng chi phí sử dụng lại tăng vọt

OpenAI đã công bố mức giá mới cho GPT-5.5, cao hơn gấp đôi so với người tiền nhiệm GPT-5.4. Dù mô hình mới được quảng cáo là hiệu quả hơn, các phân tích thực tế cho thấy chi phí tổng thể vẫn tăng đáng kể.

Không chỉ giá xăng dầu tăng phi mã, giá của các mô hình AI tiên phong (frontier-model) cũng đang leo thang chóng mặt.

OpenAI vừa nâng cấp dòng mô hình GPT lên phiên bản 5.5 vào tháng trước, đi kèm với đó là sự tăng giá trên mỗi token. Trong một số trường hợp, mức giá đã tăng gấp đôi so với người tiền nhiệm GPT-5.4.

Giá cả tăng mạnh

Cụ thể, với 1 triệu token, GPT-5.5 có giá là 5 USD cho đầu vào, 0,50 USD cho đầu vào đã lưu trong bộ nhớ đệm (cached input), và 30 USD cho đầu ra. Trong khi đó, GPT-5.4 chỉ tính phí 2,50 USD (đầu vào), 0,25 USD (cached input) và 15 USD (đầu ra) cho cùng khối lượng token.

Gã khổng lồ AI khẳng định rằng sự gia tăng chi phí này được bù đắp một phần nhờ hiệu quả xử lý token cao hơn — tức là đạt được kết quả tốt hơn với ít token hơn.

"Mặc dù GPT-5.5 có giá cao hơn GPT-5.4, nó thông minh hơn và hiệu quả về token hơn nhiều," đại diện OpenAI tuyên bố trong buổi ra mắt.

Tuy nhiên, thực tế cho thấy chi phí vẫn đang tăng lên, vượt xa mức tiết kiệm mà hiệu quả mang lại.

Phân tích thực tế từ OpenRouter

Theo một phân tích từ OpenRouter, GPT-5.5 đắt hơn từ 50% đến gần gấp đôi, tùy thuộc vào độ dài của lời nhắc (prompt).

"Phân tích của chúng tôi cho thấy chi phí thực tế của GPT-5.5 tăng từ 49% đến 92%," OpenRouter cho biết. "Những lời nhắc dài, trên 10k token, thấy chi phí được bù đắp một phần nhờ các câu trả lời ngắn hơn. Ngược lại, những lời nhắc ngắn, dưới 10k token, lại chịu mức tăng chi phí cao hơn vì độ dài câu trả lời không giảm đi nhiều."

Con số 49% đến 92% này đã tính đến sự cải thiện hiệu quả token của mô hình, yếu tố này có tác động lớn hơn đối với các lời nhắc dài. Theo đo lường của OpenRouter, GPT-5.5 tạo ra ít hơn từ 19% đến 34% token hoàn thành cho các lời nhắc dài (10.000 token trở lên).

Áp lực tài chính và xu hướng chung

Nếu các báo cáo về khoản lỗ dự kiến 14 tỷ USD của OpenAI vào năm 2026 là chính xác, chi phí buộc phải tăng thêm nhiều nữa để cân bằng với mức chi tiêu khổng lồ. Đây cũng là vấn đề mà đối thủ Anthropic đang phải đối mặt, với dự kiến lỗ 11 tỷ USD trong năm 2026.

Mới đây, Anthropic đã ra mắt Claude Opus 4.7 mà không thay đổi giá niêm yết rõ ràng, đồng thời quảng cáo về bộ mã hóa token (tokenizer) cải tiến. Kết quả, theo OpenRouter, là khả năng tiết kiệm cho các lời nhắc ngắn nhưng hóa đơn lớn hơn cho các lời nhắn dài.

"Nghiên cứu của chúng tôi về việc sử dụng Opus 4.7 thực tế cho thấy chi phí tăng 12–27% đối với các lời nhắc trên 2K token khi tính đến việc hấp thụ cache," OpenRouter nhận định. "Lời nhắc ngắn dưới 2K là ngoại lệ, nơi các câu trả lời ngắn hơn đáng kể đã bù đắp hoàn toàn chi phí bộ mã hóa."

Người dùng có thể kỳ vọng thêm các đợt tăng giá cho các mô hình cao cấp trong tương lai.

GPT-5.5: Tiết kiệm token nhưng chi phí sử dụng lại tăng vọt

Giá cả tăng mạnh

Phân tích thực tế từ OpenRouter

Áp lực tài chính và xu hướng chung

Bài viết liên quan