Đánh giá GLM-5.2: Mô hình AI thông minh nhất phân khúc Open Weights với tốc độ ấn tượng

GLM-5.2 (max) từ Z AI đã đạt điểm số cao nhất về trí tuệ trong nhóm các mô hình Open Weights, vượt xa các đối thủ cùng phân khúc. Mặc dù sở hữu tốc độ xử lý cực nhanh và cửa sổ ngữ cảnh lên tới 1 triệu token, mô hình này lại có chi phí sử dụng khá đắt đỏ so với mặt bằng chung.

Z AI đã chính thức ra mắt GLM-5.2 (max), một mô hình ngôn ngữ lớn (LLM) thuộc dạng Open Weights (trọng số mở) với khả năng lý luận (reasoning) mạnh mẽ. Theo các bài kiểm tra chuẩn hóa mới nhất từ Artificial Analysis, GLM-5.2 đang tạo được tiếng vang lớn nhờ xếp hạng đầu tiên về trí tuệ trong lớp mô hình của mình, dù vẫn còn những điểm cần cân nhắc về chi phí.

Hiệu suất trí tuệ vượt trội

Điểm nổi bật nhất của GLM-5.2 (max) là chỉ số Intelligence. Mô hình này đạt số điểm 51 trên Artificial Analysis Intelligence Index, xếp hạng #1 trong số 92 mô hình cùng phân khúc. Điểm số này cao hơn đáng kể so với mức trung bình của các mô hình tương tự (trung bình là 24).

Đây là một mô hình lý luận (reasoning model), có khả năng xử lý các tác vụ phức tạp thông qua chuỗi suy luận (chain-of-thought). Trong quá trình đánh giá, GLM-5.2 đã tạo ra tổng cộng 140 triệu token, cho thấy mô hình có xu hướng diễn đạt khá dài dòng (verbose) so với mức trung bình 110 triệu token của các đối thủ.

Tốc độ xử lý ấn tượng

Về mặt hiệu suất, GLM-5.2 (max) chứng tỏ mình là một trong những mô hình nhanh nhất hiện nay.

Tốc độ đầu ra: Mô hình đạt tốc độ 112,4 token mỗi giây, xếp hạng #15/92 và nhận được đánh giá 4/4 đơn vị về tốc độ. Con số này vượt xa mức trung bình của các mô hình Open Weights cùng kích thước (khoảng 60,7 token/giây).
Độ trễ: Thời gian để trả về token đầu tiên (Time to First Token) là khoảng 2,40 giây, ở mức trung bình khá.

Chi phí sử dụng cao

Tuy nhiên, "điểm yếu" lớn nhất của GLM-5.2 (max) lại nằm ở vấn đề tài chính. Mô hình này được đánh giá là "đặc biệt đắt đỏ" khi so sánh với các mô hình Open Weights khác có kích thước tương tự:

Giá đầu vào (Input): 1,40 USD cho mỗi 1 triệu token (trung bình ngành là 0,42 USD).
Giá đầu ra (Output): 4,40 USD cho mỗi 1 triệu token (trung bình ngành là 1,25 USD).

Tổng chi phí để đánh giá GLM-5.2 trên Chỉ số Trí tuệ lên tới 867,88 USD. Nếu sử dụng tỷ lệ kết hợp (blended rate) 7:2:1 (cache hit/input/output), giá thành vẫn ở mức 0,90 USD cho mỗi 1 triệu token.

Thông số kỹ thuật và Khả năng mở rộng

GLM-5.2 (max) được xây dựng dựa trên kiến trúc Mixture of Experts (MoE), giúp tối ưu hóa hiệu quả suy luận:

Tổng tham số: 753 tỷ tham số.
Tham số hoạt động: Chỉ 40 tỷ tham số được kích hoạt cho mỗi token trong quá trình suy luận.
Cửa sổ ngữ cảnh (Context Window): Lên tới 1 triệu token, tương đương khoảng 1.500 trang văn bản A4, cho phép xử lý lượng dữ liệu đầu vào khổng lồ.
Giấy phép: MIT, cho phép sử dụng thương mại tự do.
Đa phương thức: Hiện tại, mô hình chỉ hỗ trợ nhập và xuất dữ liệu dạng văn bản (text-only), chưa hỗ trợ xử lý hình ảnh.

Kết luận

GLM-5.2 (max) của Z AI là một bước tiến lớn trong cộng đồng các mô hình Open Weights, đặc biệt đối với các ứng dụng yêu cầu trí tuệ nhân tạo cao và tốc độ phản hồi nhanh. Tuy nhiên, với mức giá cao hơn nhiều lần so với mặt bằng chung, mô hình này có thể sẽ phù hợp hơn với các doanh nghiệp hoặc dự án có ngân sách dồi dào thay vì người dùng cá nhân hoặc các dự án khởi nghiệp nhỏ.