Đánh giá GLM-5.2: Mô hình AI có trí thông minh hàng đầu nhưng giá thành khá đắt đỏ

Mô hình GLM-5.2 (max) mới ra mắt của Z AI đang dẫn đầu về chỉ số trí thông minh trong nhóm các mô hình có trọng số mở (open weights). Tuy nhiên, dù sở hữu tốc độ xử lý ấn tượng, mô hình này lại có chi phí sử dụng cao hơn đáng kể so với mặt bằng chung và có xu hướng dài dòng.

Z AI đã chính thức ra mắt GLM-5.2 (max), một mô hình ngôn ngữ lớn (LLM) thuộc dạng "open weights" (trọng số mở) và được thiết kế với khả năng suy luận (reasoning) nâng cao. Theo các bài kiểm tra chuẩn hóa mới nhất từ Artificial Analysis, GLM-5.2 đang tạo được tiếng vang lớn nhờ xếp hạng trí thông minh hàng đầu, dù vẫn còn những điểm hạn chế về chi phí vận hành.

Hiệu suất vượt trội về trí thông minh

Điểm nổi bật nhất của GLM-5.2 (max) chính là khả năng xử lý thông tin. Mô hình này đạt điểm số 51 trên Chỉ số Trí thông minh (Artificial Analysis Intelligence Index), xếp vị trí số 1 trong số 925 mô hình được đánh giá. Điểm số này cao hơn đáng kể so với mức trung bình của các mô hình cùng phân khúc (trung bình là 24).

Đây là một mô hình lý luận (reasoning model), nghĩa là nó sử dụng quy trình "suy nghĩ mở rộng" hoặc chuỗi tư duy (chain-of-thought) để giải quyết các vấn đề phức tạp trước khi đưa ra câu trả lời cuối cùng. Điều này giúp nó thể hiện xuất sắc trong các bài kiểm tra đòi hỏi khả năng phân tích và lập luận cao.

Tốc độ xử lý ấn tượng

Bên cạnh trí thông minh, tốc độ phản hồi cũng là một thế mạnh của GLM-5.2. Mô hình này đạt tốc độ tạo ra 112,4 token mỗi giây, xếp thứ 15 trong bảng xếp hạng tốc độ. Con số này nhanh hơn đáng kể so với tốc độ trung bình của các đối thủ cùng phân khúc (khoảng 60,7 token/giây), giúp mô hình phù hợp cho các ứng dụng yêu cầu phản hồi thời gian thực.

Chi phí sử dụng đắt đỏ

Tuy nhiên, ưu điểm về hiệu suất lại đi kèm với cái giá khá đắt. GLM-5.2 (max) được đánh giá là "đặc biệt đắt đỏ" khi so sánh với các mô hình open weights có kích thước tương tự.

Giá đầu vào (Input): 1,40 USD cho 1 triệu token (trung bình ngành là 0,42 USD).
Giá đầu ra (Output): 4,40 USD cho 1 triệu token (trung bình ngành là 1,25 USD).

Tổng chi phí để đánh giá mô hình này trên Chỉ số Trí thông minh lên tới 867,88 USD, một con số phản ánh rõ ràng gánh nặng tài chính khi triển khai ở quy mô lớn. Ngoài ra, mô hình cũng có xu hướng dài dòng (verbose), tạo ra lượng token đầu ra lớn hơn mức trung bình để hoàn thành các nhiệm vụ.

Thông số kỹ thuật và Khả năng

Về mặt kỹ thuật, GLM-5.2 (max) sở hữu thông số cấu hình ấn tượng:

Kiến trúc: Sử dụng kiến trúc Mixture of Experts (MoE) với tổng cộng 753 tỷ tham số, nhưng chỉ 40 tỷ tham số hoạt động (active parameters) tại một thời điểm suy luận. Điều này giúp tối ưu hóa hiệu suất mà không quá tốn tài nguyên.
Cửa sổ ngữ cảnh (Context Window): Hỗ trợ tối đa 1 triệu token, tương đương khoảng 1.500 trang văn bản A4. Điều này mở rộng khả năng xử lý các tài liệu dài và duy trì ngữ cảnh hội thoại rộng.
Giấy phép: Được phát hành dưới giấy phép MIT, cho phép sử dụng thương mại tự do.
Đa phương thức: Hiện tại, mô hình chỉ hỗ trợ nhập và xuất dữ liệu dạng văn bản (text-only), chưa hỗ trợ xử lý hình ảnh.

Kết luận

GLM-5.2 (max) của Z AI là một bước tiến đáng kể trong cộng đồng các mô hình AI open weights, đặc biệt là về mặt trí thông minh và tốc độ. Tuy nhiên, với mức giá cao hơn nhiều so với mặt bằng chung, mô hình này có thể sẽ phù hợp hơn với các doanh nghiệp hoặc ứng dụng yêu cầu độ chính xác cao nhất mà không quá bận tâm về chi phí, thay vì cho các dự án phổ thông cần tối ưu hóa ngân sách.