ASI-EVOLVE: Khung AI tự động tối ưu hóa dữ liệu và kiến trúc, vượt xa hiệu suất của con người

ASI-EVOLVE là khung hệ thống AI mới từ SII-GAIR có khả năng tự động hóa toàn bộ quy trình nghiên cứu và tối ưu hóa, từ dữ liệu huấn luyện đến kiến trúc mô hình. Trong các thử nghiệm, hệ thống này đã tạo ra các thiết kế mới vượt xa các chuẩn mực do con người thiết kế, giúp cải thiện đáng kể điểm số benchmark. Khung công nghệ này mở ra cơ hội giảm thiểu chi phí kỹ thuật thủ công cho các đội ngũ phát triển AI doanh nghiệp.

Nghiên cứu và phát triển AI (R&D) thường vận hành trong một chu trình lặp đi lặp lại gồm giả thuyết, thực nghiệm và phân tích, trong đó mỗi bước đều đòi hỏi rất nhiều nỗ lực kỹ thuật thủ công. Một khung hệ thống mới từ các nhà nghiên cứu tại SII-GAIR nhằm giải quyết điểm nghẽn này bằng cách tự động hóa toàn bộ vòng lặp tối ưu hóa cho dữ liệu huấn luyện, kiến trúc mô hình và các thuật toán học tập.

Khung hệ thống mới có tên ASI-EVOLVE, được phát triển bởi các nhà nghiên cứu tại Phòng thí nghiệm Nghiên cứu AI tạo sinh (SII-GAIR), được thiết kế như một hệ thống tác nhân (agentic system) dành cho nghiên cứu AI-for-AI. Nó sử dụng chu trình liên tục "học - thiết kế - thực nghiệm - phân tích" để tự động hóa việc tối ưu hóa toàn bộ nền tảng cốt lõi của AI.

Trong các thí nghiệm, vòng lặp tự cải thiện này đã tự khám phá ra các thiết kế mới vượt trội đáng kể so với các chuẩn mực do con người thiết kế hiện nay. Hệ thống đã tạo ra các kiến trúc mô hình ngôn ngữ mới, cải thiện quy trình dữ liệu tiền huấn luyện để tăng điểm benchmark hơn 18 điểm, và thiết kế các thuật toán học tăng cường (reinforcement learning) cực kỳ hiệu quả.

Đối với các đội ngũ doanh nghiệp thường xuyên chạy các chu trình tối ưu hóa trên hệ thống AI của mình, khung hệ thống này mở ra con đường giảm thiểu chi phí kỹ thuật thủ công trong khi vẫn đảm bảo hiệu suất ngang bằng hoặc vượt qua các thiết kế cơ bản do con người tạo ra.

Nút thắt về dữ liệu và thiết kế

Các đội ngũ kỹ thuật hiện nay chỉ có thể khám phá một phần rất nhỏ trong không gian thiết kế khổng lồ của các mô hình AI tại bất kỳ thời điểm nào. Việc thực hiện các quy trình làm việc thực nghiệm đòi hỏi nỗ lực thủ công tốn kém và sự can thiệp thường xuyên của con người. Hơn nữa, những hiểu biết thu được từ các chu trình tốn kém này thường bị cô lập thành trực giác hoặc kinh nghiệm cá nhân, khiến việc lưu giữ và chuyển giao kiến thức một cách có hệ thống cho các dự án trong tương lai trở nên khó khăn. Những hạn chế này về cơ bản đã kìm hãm tốc độ và quy mô đổi mới AI.

Mặc dù AI đã đạt được những bước tiến đáng kinh ngạc trong khám phá khoa học, từ các công cụ chuyên biệt như AlphaFold giải quyết các vấn đề sinh học rời rạc đến các hệ thống tác nhân trả lời các câu hỏi khoa học cơ bản, nhưng các khung hệ thống hiện tại vẫn gặp khó khăn trong việc đổi mới AI mở và chủ yếu bị giới hạn trong việc tối ưu hóa hẹp trong các ràng buộc rất cụ thể.

Việc nâng cao các khả năng cốt lõi của AI phức tạp hơn nhiều. Nó đòi hỏi việc sửa đổi các cơ sở mã lớn phụ thuộc lẫn nhau, chạy các thí nghiệm tốn nhiều tài nguyên tính toán tiêu tốn hàng trăm giờ GPU, và phân tích phản hồi đa chiều từ động lực huấn luyện.

"Các khung hệ thống hiện tại chưa chứng minh được rằng AI có thể hoạt động hiệu quả trong chế độ này một cách thống nhất, cũng như chưa thể tạo ra những bước tiến có ý nghĩa trên ba trụ cột nền tảng của phát triển AI thay vì chỉ trong một cài đặt hẹp duy nhất," các nhà nghiên cứu viết.

Cách ASI-EVOLVE học cách nghiên cứu

Để vượt qua các hạn chế của R&D thủ công, ASI-EVOLVE hoạt động dựa trên một vòng lặp liên tục giữa kiến thức trước đó, tạo giả thuyết, thực nghiệm và tinh chỉnh. Hệ thống học hỏi kiến thức liên quan và kinh nghiệm lịch sử từ các cơ sở dữ liệu hiện có, thiết kế một chương trình ứng viên đại diện cho giả thuyết tiếp theo của nó, chạy các thí nghiệm để thu được tín hiệu đánh giá và phân tích kết quả thành các bài học có thể tái sử dụng, dễ đọc cho con người để đưa trở lại cơ sở kiến thức của nó.

Có hai thành phần chính thúc đẩy ASI-EVOLVE. "Cognition Base" (Cơ sở nhận thức) đóng vai trò là chuyên môn lĩnh vực nền tảng của hệ thống. Để tăng tốc quá trình tìm kiếm, hệ thống được tải sẵn kiến thức của con người, các heuristic liên quan đến nhiệm vụ và các cạm bẫy đã biết được trích xuất từ tài liệu hiện có. Điều này dẫn dắt việc khám phá hướng tới các hướng đi đầy hứa hẹn ngay từ lần lặp đầu tiên.

Thành phần thứ hai là "Analyzer" (Trình phân tích), giải quyết phản hồi phức tạp, đa chiều từ các thí nghiệm. Nó xử lý nhật ký huấn luyện thô, kết quả benchmark và dấu vết hiệu quả, chưng cất chúng thành các thông tin chi tiết có thể hành động và phân tích nguyên nhân.

Một số mô-đun bổ sung khác kết hợp khung hệ thống lại với nhau. Một tác nhân "Researcher" (Nhà nghiên cứu) xem xét kiến thức trước đó từ cơ sở nhận thức và kết quả thực nghiệm trong quá khứ để tạo ra các giả thuyết mới, hoặc đề xuất sửa đổi mã cục bộ hoặc viết các chương trình mới.

Thành phần "Engineer" (Kỹ sư) chạy các thí nghiệm thực tế. Vì các thử nghiệm huấn luyện AI cực kỳ tốn kém, Kỹ sư được trang bị các biện pháp hiệu quả như giới hạn thời gian thực và các bài kiểm tra loại bỏ nhanh để lọc bỏ các chương trình ứng viên bị lỗi trước khi chúng tiêu tốn quá nhiều giờ GPU.

Cuối cùng, "Database" (Cơ sở dữ liệu) đóng vai trò là bộ nhớ liên tục của hệ thống, lưu trữ mã, động lực nghiên cứu, kết quả thô và báo cáo cuối cùng của Trình phân tích cho mọi lần lặp, đảm bảo rằng các thông tin chi tiết được tích lũy có hệ thống theo thời gian.

Bằng cách thống nhất các thành phần này, ASI-EVOLVE đảm bảo rằng một tác nhân AI học hỏi có hệ thống từ phản hồi thực nghiệm phức tạp trong thế giới thực mà không cần sự can thiệp liên tục của con người.

Trong khi các khung hệ thống trước đây được thiết kế để tiến hóa các giải pháp ứng viên, "ASI-EVOLVE tiến hóa chính nhận thức," các nhà nghiên cứu viết. "Kinh nghiệm tích lũy và thông tin chi tiết được chưng cất được lưu trữ và truy xuất liên tục để thông báo cho việc khám phá trong tương lai, đảm bảo rằng hệ thống không chỉ phát triển về chất lượng giải pháp mà còn về khả năng lý luận về nơi để tìm kiếm tiếp theo."

ASI-EVOLVE trong hành động

Trong các thí nghiệm của mình, các nhà nghiên cứu đã chứng minh rằng ASI-EVOLVE có thể cải thiện thành công việc tuyển chọn dữ liệu, kiến trúc mô hình và thuật toán học tập để tạo ra các hệ thống AI tốt hơn.

Đối với các ứng dụng doanh nghiệp thực tế, dữ liệu chất lượng cao là một nút thắt kéo dài. Khi được giao nhiệm vụ thiết kế các chiến lược làm sạch theo danh mục cho các kho dữ liệu tiền huấn luyện khổng lồ, ASI-EVOLVE đã kiểm tra các mẫu dữ liệu và chẩn đoán các vấn đề chất lượng như tạo tác HTML và sự không nhất quán về định dạng. Hệ thống đã tự xây dựng các quy tắc tuyển chọn tùy chỉnh, phát hiện ra rằng việc làm sạch có hệ thống kết hợp với các quy tắc bảo toàn nhận biết lĩnh vực hiệu quả hơn nhiều so với việc lọc bỏ mạnh mẽ.

Trong các bài kiểm tra benchmark, các mô hình có 3 tỷ tham số được huấn luyện trên dữ liệu do AI tuyển chọn đã thấy mức tăng điểm trung bình gần 4 điểm so với các mô hình được huấn luyện trên dữ liệu thô. Mức tăng cao nhất là ở các nhiệm vụ đòi hỏi nhiều kiến thức, với hiệu suất tăng hơn 18 điểm trên Massive Multitask Language Understanding (MMLU), một benchmark LLM bao gồm các nhiệm vụ trên STEM, nhân văn và khoa học xã hội.

Ngoài dữ liệu, hệ thống chứng minh khả năng cao trong thiết kế kiến trúc mạng nơ-ron. Trên 1.773 vòng khám phá tự chủ, nó đã tạo ra 105 kiến trúc chú ý tuyến tính mới vượt qua DeltaNet, một đường cơ sở do con người thiết kế cực kỳ hiệu quả. Để đạt được kết quả này, ASI-EVOLVE đã phát triển các cơ chế định tuyến đa quy mô điều chỉnh động ngân sách tính toán của mô hình dựa trên nội dung cụ thể của đầu vào.

Cuối cùng, trong thiết kế thuật toán học tăng cường, ASI-EVOLVE đã khám phá ra các cơ chế tối ưu hóa mới. Nó đã thiết kế các thuật toán vượt qua đường cơ sở GRPO cạnh tranh trên các benchmark lý luận toán học phức tạp như AMC32 và AIME24. Một biến thể thành công đã phát minh ra một "Budget-Constrained Dynamic Radius" giữ cho các cập nhật mô hình nằm trong một ngân sách xác định, hiệu quả ổn định việc huấn luyện trên dữ liệu nhiễu.

Ý nghĩa đối với AI doanh nghiệp

Quy trình làm việc AI của doanh nghiệp liên tục yêu cầu tối ưu hóa đối với các hệ thống hiện có, từ tinh chỉnh các mô hình mã nguồn mở trên dữ liệu độc quyền đến thực hiện các thay đổi nhỏ đối với kiến trúc và thuật toán. Thông thường, tài nguyên tính toán và giờ kỹ thuật cần thiết để thực hiện các nỗ lực này là rất lớn và vượt quá khả năng của hầu hết các tổ chức. Kết quả là nhiều tổ chức phải chạy các phiên bản chưa được tối ưu hóa của các mô hình AI tiêu chuẩn.

Đội ngũ nghiên cứu cho biết khung hệ thống được thiết kế để các doanh nghiệp có thể tích hợp kiến thức lĩnh vực độc quyền vào kho lưu trữ nhận thức và cho phép vòng lặp tự chủ lặp lại trên các hệ thống AI nội bộ.

Đội ngũ nghiên cứu đã mã nguồn mở mã ASI-EVOLVE, biến khung hệ thống nền tảng này trở nên khả dụng cho các nhà phát triển và người xây dựng sản phẩm.