Decart ra mắt Oasis 3: Mô hình thế giới tạo môi trường lái xe chân thực theo thời gian thực

Công nghệ10 tháng 6, 2026·5 phút đọc

Decart vừa công bố Oasis 3, mô hình thế giới tương tác có thể tạo ra môi trường lái xe chân thực theo thời gian thực thông qua API. Mô hình này hướng đến các công ty xe tự lái và cộng đồng nhà phát triển, hứa hẹn khả năng mô phỏng các tình huống hiếm gặp với chi phí thấp nhờ tối ưu hóa phần cứng.

Decart ra mắt Oasis 3: Mô hình thế giới tạo môi trường lái xe chân thực theo thời gian thực

Startup AI Decart đã chính thức công bố Oasis 3, mô hình thế giới tương tác mới nhất có khả năng tạo ra môi trường lái xe chân thực như ảnh chụp (photorealistic) theo thời gian thực. Hiện tại, mô hình này đã được cung cấp cho các nhà phát triển thông qua API.

Ban đầu, Decart tập trung vào các công ty xe tự lái cần mô phỏng các tình huống lái xe hiếm gặp ở quy mô lớn, đồng thời có kế hoạch mở rộng sang lĩnh vực robot và các ứng dụng AI vật lý khác. Tuy nhiên, mục tiêu lớn hơn của công ty là hướng tới cộng đồng lập trình viên. Bằng cách cung cấp quyền truy cập API ngay từ ngày đầu, Decart muốn xây dựng một hệ sinh thái nhà phát triển xung quanh các mô hình thế giới, tương tự như cách OpenAI đã làm với các mô hình ngôn ngữ.

Mô phỏng lái xe với Oasis 3Mô phỏng lái xe với Oasis 3

“Đây sẽ là mô hình thế giới có thể sử dụng được đầu tiên mà mọi người thực sự có thể lập trình trên đó,” Dean Leitersdorf, đồng sáng lập và CEO của Decart, chia sẻ. “Tôi tin rằng sẽ có một cộng đồng nhà phát triển toàn diện hình thành dựa trên nền tảng này.”

Hiệu suất và Chi phí

Decart hiện đã có cộng đồng hơn 100.000 nhà phát triển, nhiều người trong số họ đang xây dựng sản phẩm dựa trên mô hình video thời gian thực Lucy của công ty, chủ yếu trong lĩnh vực thương mại điện tử và phát trực tiếp. Oasis 3 được xây dựng dựa trên mô hình nền tảng đó, đánh dấu bước tiến của công ty vào AI vật lý. Theo Decart, giá truy cập hiện tại là 0,02 USD mỗi giây, trong khi giá doanh nghiệp sẽ phụ thuộc vào trường hợp sử dụng.

Mô phỏng đường phố New YorkMô phỏng đường phố New York

Oasis 3 tạo ra các môi trường lái xe chính xác về mặt vật lý với nhiều góc camera — một camera phía trước và hai camera bên hông — để huấn luyện và kiểm thử hệ thống. Thay vì chỉ cung cấp bản giới thiệu hạn chế, Decart cho phép các nhà phát triển tạo ra các tình huống vô tận, rất lý tưởng cho những người phát triển xe tự lái muốn thử nghiệm càng nhiều trường hợp ngoại lệ (edge cases) càng tốt.

So với các mô hình khác như Google Genie 3 hay World Labs’s Marble, Oasis 3 mang lại môi trường chân thực nhất từ một câu lệnh văn bản. Tuy nhiên, khả năng tương tác trong thời gian dài cũng bộc lộ những hạn chế nhất định về hiệu suất mà các đối thủ cũng đang gặp phải.

Tối ưu hóa phần cứng

Điểm mạnh của Oasis 3 nằm ở độ chân thực của hình ảnh và khả năng tạo sinh vô hạn. Điều này là nhờ vào những thuật toán tối ưu hóa từ Decart, được hỗ trợ bởi sản phẩm chính khác của công ty: phần mềm DOS (Decart Optimization Stack). Phần mềm này cho phép các mô hình hoạt động hiệu quả trên phần cứng của Nvidia, Amazon và Google, giúp chi phí vận hành thấp hơn nhiều so với đối thủ.

“Điều này được xây dựng dựa trên toàn bộ ngăn xếp thời gian thực của chúng tôi, mà chúng tôi tối ưu hóa xuống tận phần cứng,” Leitersdorf nói. “Nhờ sự tích hợp dọc như vậy, chúng tôi có thể rẻ hơn đối thủ trong ngành hơn một cấp độ bậc magnitude khi vận hành các mô hình này.”

Những hạn chế hiện tại

Mặc dù ấn tượng ban đầu, Oasis 3 vẫn có những điểm yếu. Trong quá trình thử nghiệm, hệ thống có thể thiết lập một cảnh mở đầu mạnh mẽ khớp với câu lệnh, nhưng tính toàn vẹn chủ đề sẽ suy giảm nhanh chóng khi di chuyển trong thế giới đó.

Ví dụ, khi được yêu cầu tạo ra một con phố ở New York vào buổi sáng, mô hình đã thực hiện rất đẹp. Tuy nhiên, khi lái xe đi xa hơn, môi trường dần trông giống như một thành phố phương Tây chung chung thay vì New York. Khi cố gắng quay lại ngã tư ban đầu, nó đã biến mất, thay thế bởi một môi trường hoàn toàn mới.

Sự suy giảm tính nhất quán của mô hìnhSự suy giảm tính nhất quán của mô hình

Ngoài ra, các điều khiển không quá nhạy bén và người dùng thường mất kiểm soát hướng di chuyển. Một vấn đề khác là xe có thể lao xuyên qua các xe khác, nghĩa là mô hình chưa mô phỏng vật lý đúng cách trong môi trường. Leitersdorf gọi đây là “vấn đề nghiên cứu lớn mà chúng tôi đang giải quyết”, và giải thích rằng do dữ liệu về lái xe an toàn nhiều hơn nhiều so với dữ liệu về tai nạn.

Oasis 3 là một mô hình tự hồi quy (auto-regressive), nghĩa là nó tạo ra từng khung hình một lần và nhìn lại những gì nó đã tạo ra để quyết định điều gì sẽ tiếp theo. Để duy trì tính nhất quán, nhóm Decart đang nỗ lực cải thiện độ dài bộ nhớ của mô hình, vì cửa sổ ngữ cảnh (context window) sẽ bị lấp đầy rất nhanh chóng khi tạo ra hàng trăm nghìn token mỗi giây.

CEO của Decart tin rằng vấn đề về tính nhất quán có thể được giải quyết một phần trong phiên bản tiếp theo, cho phép người dùng tạo thế giới dựa trên video của môi trường thay vì chỉ là hình ảnh. Dù lĩnh vực mô hình thế giới vẫn còn ở giai đoạn sơ khai, nhưng Leitersdorf tin tưởng rằng khi các nhà phát triển tiếp cận công nghệ này, họ sẽ tạo ra những ứng dụng bất ngờ.

Chia sẻ:FacebookX
Nội dung tổng hợp bằng AI, mang tính tham khảo. Xem bài gốc ↗