Poolside công bố mô hình AI lập trình Laguna M.1 và XS.2, mở trọng số cho cộng đồng

Poolside.ai giới thiệu hai mô hình AI chuyên biệt cho lập trình là Laguna M.1 và XS.2, trong đó XS.2 được phát hành dưới dạng open-weight. Các mô hình này sử dụng kiến trúc Mixture of Experts và đạt hiệu suất ấn tượng trên các benchmark lập trình, hướng tới khả năng xây dựng các tác nhân AI tự động hóa quy trình phần mềm.

Startup công nghệ Poolside.ai đã chính thức ra mắt hai mô hình đầu tiên trong dòng sản phẩm Laguna: Laguna M.1 và Laguna XS.2. Đây là những mô hình AI được thiết kế chuyên biệt cho các tác vụ lập trình (coding) và vận hành bởi các tác nhân thông minh (agents), đặc biệt nổi bật với khả năng xử lý các nhiệm vụ dài hạn.

Đáng chú ý, Poolside quyết định phát hành phiên bản trọng số mở (open weights) cho Laguna XS.2 dưới giấy phép Apache 2.0, cho phép các nhà phát triển tự do tùy chỉnh và triển khai. Cả hai mô hình hiện đều có thể sử dụng miễn phí trong thời gian giới hạn thông qua API và trên nền tảng OpenRouter.

Tổng quan về Laguna M.1 và XS.2

Laguna M.1 là mô hình nền tảng lớn nhất của Poolside, hoàn tất quá trình tiền huấn luyện vào cuối năm ngoái. Đây là một mô hình Mixture of Experts (MoE) khổng lồ với tổng cộng 225 tỷ tham số, trong đó 23 tỷ tham số được kích hoạt cho mỗi token. Mô hình được đào tạo từ đầu trên 30 nghìn tỷ token sử dụng hệ thống 6.144 GPU NVIDIA Hopper interconnected.

Trong khi đó, Laguna XS.2 là một mô hình nhỏ gọn hơn nhưng vẫn cực kỳ mạnh mẽ đối với quy mô của nó. Với tổng cộng 33 tỷ tham số (3 tỷ kích hoạt), đây là mô hình open-weight đầu tiên của Poolside. Mặc dù nhỏ hơn, XS.2 vẫn thể hiện khả năng lập trình ấn tượng, cạnh tranh sòng phẳng với các mô hình lớn hơn trên thị trường.

Hiệu suất lập trình vượt trội

Cả hai mô hình đều được tối ưu hóa cho SWE-bench Pro và Terminal-Bench 2.0 — hai bài kiểm tra khó khăn về khả năng sửa lỗi mã nguồn và làm việc trên môi trường dòng lệnh.

Laguna M.1: Đạt 46,9% trên SWE-bench Pro và 40,7% trên Terminal-Bench 2.0.
Laguna XS.2: Đạt 44,5% trên SWE-bench Pro và 30,1% trên Terminal-Bench 2.0.

So sánh với các đối thủ như Qwen3.5, Gemma 4 hay Claude Haiku, Laguna XS.2 cho thấy hiệu suất vượt trội nhờ vào kiến trúc MoE hiệu quả, giúp tối ưu hóa việc tính toán mà không cần kích hoạt toàn bộ mạng nơ-ron.

Tầm nhìn: Lập trình cho các tác nhân AI (Agentic Coding)

Poolside tin rằng tương lai của AI không chỉ dừng lại ở việc gọi công cụ (tool calling) qua các giao diện cố định. Thay vào đó, họ hướng tới các tác nhân có khả năng viết và thực thi mã nguồn để tự tạo ra các hệ thống riêng biệt, tương tác linh hoạt với thế giới thực.

Việc tạo ra phần mềm được coi là kỹ năng cốt lõi để biểu hiện nhiều khả năng khác của AI. Do đó, Laguna được xây dựng để hỗ trợ các tác nhân thực hiện các công việc dài hạn (long-horizon work), nơi chúng có thể tự soạn thảo hành động, song song hóa quy trình và tự sửa lỗi.

Công nghệ đằng sau sự đột phá

Để đạt được hiệu suất này, Poolside đã áp dụng nhiều kỹ thuật tiên tiến:

Dữ liệu và AutoMixer Họ sử dụng sự kết hợp giữa dữ liệu web quy mô lớn và dữ liệu tổng hợp (synthetic data). Đặc biệt, framework AutoMixer của họ giúp tối ưu hóa tỷ lệ trộn dữ liệu tự động, huấn luyện một swarm các mô hình proxy để tìm ra hỗn hợp dữ liệu tốt nhất cho từng nhóm năng lực (mã, toán học, STEM).

Tối ưu hóa Muon Thay vì sử dụng AdamW truyền thống, Poolside triển khai bản phân tán của tối ưu hóa Muon. Phương pháp này giúp giảm 15% số bước huấn luyện cần thiết để đạt cùng một mức độ mất mát (loss), đồng thời giảm thiểu yêu cầu về bộ nhớ.

Học tăng cường bất đồng bộ (Agent RL) Hệ thống RL của Poolside hoạt động hoàn toàn bất đồng bộ, cho phép các tác nhân thực hiện các nhiệm vụ lập trình thực tế trong môi trường sandbox. Điều này giúp GPU không bị idle trong khi chờ dữ liệu, tối ưu hóa throughput cho các tác vụ dài hạn đòi hỏi nhiều bước lặp lại.

Hợp tác với NVIDIA và Khả năng tiếp cận

Mọi khía cạnh từ khâu tuyển dữ liệu đến huấn luyện dòng Laguna đều được thực hiện trên phần cứng của NVIDIA. Laguna XS.2 cũng được hỗ trợ ngay lập tức trên NVIDIA TensorRT-LLM và có phiên bản NVFP4 để tối ưu hóa trên kiến trúc Blackwell.

Người dùng có thể bắt đầu trải nghiệm Laguna M.1 và XS.2 miễn phí qua API của Poolside hoặc OpenRouter. Đối với các nhà nghiên cứu và nhà phát triển muốn tự triển khai, trọng số của Laguna XS.2 đã có sẵn để tải xuống. Poolside cũng cam kết sẽ sớm phát hành thêm phiên bản Laguna XS.2-base để cộng đồng dễ dàng fine-tune hơn.

Poolside công bố mô hình AI lập trình Laguna M.1 và XS.2, mở trọng số cho cộng đồng

Tổng quan về Laguna M.1 và XS.2

Hiệu suất lập trình vượt trội

Tầm nhìn: Lập trình cho các tác nhân AI (Agentic Coding)

Công nghệ đằng sau sự đột phá

Hợp tác với NVIDIA và Khả năng tiếp cận

Bài viết liên quan