Mô hình robot GEN-1 đạt độ tin cậy 99%, từ gấp hộp đến sửa máy hút bụi
Công ty robot học Generalist đã ra mắt GEN-1, một hệ thống AI vật lý mới đạt tỷ lệ thành công ở mức sản xuất trên nhiều kỹ năng thực tế. Điểm nổi bật là khả năng ứng biến với gián đoạn và tự động suy luận các động tác mới chưa từng được huấn luyện.
Công ty phát triển robot học bằng máy học Generalist vừa công bố GEN-1, một hệ thống AI vật lý mới được tuyên bố là đã "chạm đến ngưỡng tỷ lệ thành công ở cấp độ sản xuất" trên một loạt các kỹ năng vật lý đa dạng. Trước đây, những kỹ năng này thường đòi hỏi sự khéo léo và trí nhớ cơ bắp đặc trưng của bàn tay con người. Không chỉ dừng lại ở việc thực hiện các tác vụ lặp lại, Generalist còn nhấn mạnh khả năng của mô hình mới trong việc phản ứng với các gián đoạn bằng cách ứng biến các động tác mới và "kết nối các ý tưởng từ những ngữ cảnh khác nhau để giải quyết vấn đề mới".
Tiến hóa từ GEN-0 và áp dụng quy mô dữ liệu
GEN-1 được xây dựng dựa trên nền tảng của mô hình GEN-0 trước đó mà Generalist đã giới thiệu vào tháng 11. Khi đó, GEN-0 được coi là bằng chứng khái niệm cho khả năng áp dụng các quy luật mở rộng quy mô (scaling laws) trong việc huấn luyện robot, cho thấy cách dữ liệu tiền huấn luyện (pre-training data) nhiều hơn và thời gian tính toán lớn hơn sẽ cải thiện hiệu suất sau huấn luyện.
Tuy nhiên, một thách thức lớn tồn tại khác biệt so với các mô hình ngôn ngữ lớn (LLM). Trong khi các LLM có thể xử lý hiệu quả hàng nghìn tỷ từ trên internet để huấn luyện, các mô hình robot lại không có nguồn dữ liệu chất lượng tương tự về cách con người thao tác với các đồ vật.
Giải pháp "Data hands" để thu thập dữ liệu vật lý
Để giải quyết vấn đề thiếu hụt dữ liệu này, Generalist đã dựa vào thiết bị gọi là "data hands" — một bộ kẹp đeo được (wearable pincers) giúp ghi lại các chuyển động vi mô cũng như thông tin thị giác khi con người thực hiện các tác vụ thủ công.
Hiện tại, Generalist tuyên bố họ đã thu thập được hơn 500.000 giờ dữ liệu và "petabyte dữ liệu tương tác vật lý" để hỗ trợ huấn luyện cho mô hình vật lý của mình. Dữ liệu khổng lồ này là chìa khóa giúp GEN-1 đạt được độ tin cậy cao và khả năng thích ứng linh hoạt trong môi trường thực tế.



