GLM-5.2: Mô hình AI open weights mới dẫn đầu bảng xếp hạng Artificial Analysis

GLM-5.2 của Z ai đã vượt qua các đối thủ nặng ký để trở thành mô hình open weights hàng đầu với điểm số 51 trên Chỉ số Thông minh v4.1. Mô hình này ghi nhận bước tiến lớn về khả năng lập luận khoa học và hiệu suất thực tế, đồng thời cung cấp cửa sổ ngữ cảnh khổng lồ lên tới 1 triệu token.

Z ai vừa gây tiếng vang lớn trong cộng đồng trí tuệ nhân tạo với việc ra mắt GLM-5.2, mô hình mới nhất của họ đã chính thức vượt qua các đối thủ sừng sỏ để chiếm vị trí số 1 trên Chỉ số Thông minh (Intelligence Index) v4.1 của Artificial Analysis. Với điểm số ấn tượng là 51, GLM-5.2 không chỉ vượt qua MiniMax-M3 và DeepSeek V4 Pro mà còn thiết lập một tiêu chuẩn mới về hiệu suất đối với các mô hình có trọng số mở (open weights).

Minh họa hiệu suất AI

Bước nhảy vọt về hiệu suất

Điểm đáng chú ý nhất của GLM-5.2 là sự cải thiện mạnh mẽ so với phiên bản tiền nhiệm GLM-5.1. Mặc dù giữ nguyên kích thước với 744 tỷ tham số tổng thể (40 tỷ tham số hoạt động), GLM-5.2 đã ghi thêm 11 điểm trên thang điểm Intelligence Index, đạt mức 51. Điều này giúp nó vượt xa các đối thủ gần nhất như MiniMax-M3 và DeepSeek V4 Pro (cùng đạt 44 điểm).

Đặc biệt, GLM-5.2 nằm trên biên giới Pareto (Pareto frontier) trong biểu đồ so sánh giữa Trí tuệ và Chi phí trên mỗi tác vụ. Điều này có nghĩa là ở mức độ thông minh hiện tại, GLM-5.2 cung cấp mức chi phí tối ưu nhất cho người dùng.

Cải thiện vượt trội về lập luận và thực thi

Sự nâng cấp của GLM-5.2 không chỉ nằm ở con số tổng quát mà còn thể hiện rõ nét qua các bài kiểm tra cụ thể:

Lập luận khoa học: Ghi nhận mức tăng trưởng ấn tượng với bài kiểm tra CritPt (+16 điểm lên 21%) và HLE (+12 điểm lên 40%).
Khả năng lập trình và mã hóa: SciCode cải thiện 7 điểm lên 50%, trong khi TerminalBench v2.1 tăng 16 điểm lên mức 78%.
Kiến thức chuyên sâu: GPQA Diamond tăng thêm 3 điểm, đạt mức 89%.

Biểu đồ so sánh mô hình AI

Một thành tựu lớn khác là GLM-5.2 đạt điểm 1524 trên chỉ số GDPval-AA v2 — thước đo chính cho hiệu suất thực tế của các tác vụ đại lý (agentic tasks). Kết quả này giúp GLM-5.2 vượt lên trên các mô hình open weights khác và ngang hàng với các mô hình độc quyền hàng đầu như GPT-5.5 (xhigh reasoning).

Thông số kỹ thuật và Chi phí

GLM-5.2 được thiết kế để phục vụ các tác vụ phức tạp và dài hạn với các thông số kỹ thuật hấp dẫn:

Cửa sổ ngữ cảnh (Context Window): Được mở rộng đáng kể từ 200K lên 1 triệu token, cho phép xử lý các tài liệu lớn và duy trì các cuộc hội thoại dài hơn nhiều.
Giấy phép: Sử dụng giấy phép MIT, tối đa hóa khả năng tùy biến và triển khai cho các nhà phát triển.
Hiệu suất sử dụng token: Mô hình sử dụng trung bình 43k token đầu ra cho mỗi tác vụ trên Chỉ số Thông minh, cao hơn so với các phiên bản trước và một số đối thủ, đổi lấy khả năng lập luận sâu sắc hơn.

Về giá cả, GLM-5.2 được định giá cạnh tranh thông qua API chính thức của Z ai là $1,4 cho mỗi 1 triệu token đầu vào, $4,4 cho token đầu ra và $0,26 cho cache hit.

Khả năng tiếp cận

Ngoài việc cung cấp thông qua API chính thức, GLM-5.2 còn được phân phối rộng rãi trên nhiều nền tảng bên thứ ba bao gồm DeepInfra, Novita, Nebius, Parasail, Siliconflow, GMI Cloud, Baseten và Fireworks. Điều này giúp các nhà phát triển trên toàn thế giới, bao gồm cả tại Việt Nam, có thể dễ dàng tiếp cận và tích hợp mô hình mạnh mẽ này vào các sản phẩm của mình.

Hình ảnh minh họa công nghệ

Với sự ra mắt của GLM-5.2, cuộc đua trong lĩnh vực mô hình ngôn ngữ mã nguồn mở đang trở nên khốc liệt hơn bao giờ hết, mang lại nhiều lựa chọn chất lượng cao cho cộng đồng công nghệ.