Cựu nhân sự Google và Apple thành lập startup Trajectory nhằm giải quyết vấn đề "học tập liên tục" cho AI

Startup Trajectory, được thành lập bởi các cựu nhân sự từ Google DeepMind, Apple và OpenAI, đang phát triển một nền tảng giúp các sản phẩm AI học hỏi liên tục từ dữ liệu người dùng thực tế. Công ty này vừa huy động được 15 triệu USD vòng hạt giống để hiện thực hóa tầm nhìn về vòng lặp phản hồi tự động cho trí tuệ nhân tạo.

Một nhóm các nhà nghiên cứu AI từng làm việc tại Google DeepMind, Apple, OpenAI và Meta Superintelligence Labs đã công bố ra mắt startup mới có tên Trajectory vào thứ Tư vừa qua. Mục tiêu của công ty là giúp các doanh nghiệp cải thiện sản phẩm AI thường xuyên thông qua việc đào tạo dựa trên các tương tác thực tế của người dùng.

Trajectory muốn xây dựng một nền tảng AI có khả năng học tập liên tục (continual learning) — một năng lực mà giới nghiên cứu lâu nay coi là rào cản lớn đối với sự tiến bộ của trí tuệ nhân tạo. Các ông lớn như OpenAI, Google và Anthropic đã đạt được thành công trong việc đào tạo các phiên bản mô hình AI ngày càng mạnh mẽ, đặc biệt trong các lĩnh vực như lập trình, toán học và khoa học. Tuy nhiên, các hệ thống này sẽ ngừng thông minh hơn sau khi quá trình đào tạo kết thúc. Mặc dù có một số bước đột phá gần đây về học tập liên tục, nhưng các công ty công nghệ nói chung vẫn gặp khó khăn trong việc tạo ra sản phẩm AI có thể học hỏi từ sai lầm của mình theo thời gian thực.

Tại hội nghị NeurIPS vào tháng 12 năm 2025, người đoạt giải Turing Richard Sutton đã lập luận rằng học tập liên tục là yếu tố thiết yếu để xây dựng các tác nhân siêu thông minh.

Trajectory đã huy động thành công vòng hạt giống (seed round) trị giá 15 triệu USD với định giá sau tiền (post-money) là 115 triệu USD. Vòng gọi vốn này do công ty vốn mạo hiểm Conviction dẫn đầu, cùng sự tham gia của Bessemer Venture Partners, Radical VC và BoxGroup. Các nhà đầu tư cá nhân cũng tham gia, bao gồm nhà khoa học trưởng của Google DeepMind, Jeff Dean, cũng như giáo sư Stanford và CEO của World Labs, Fei-Fei Li — người được mệnh danh là "mẹ đỡ đầu của AI".

CEO và đồng sáng lập Trajectory, Ronak Malde, trước đây là nhà nghiên cứu AI tại Windsurf. Ông sau đó trở thành một trong số ít nhân sự chuyển sang làm việc tại Google DeepMind khi gã khổng lồ này thâu tóm các nhân tài hàng đầu của startup lập trình đó trong thương vụ trị giá 2,4 tỷ USD vào năm ngoái. Các đồng sáng lập khác của Trajectory bao gồm Arjun Karanam, cựu nhà nghiên cứu AI tại Apple từng làm việc trên Vision Pro, và Michael Elabd, người từng làm việc tại bộ phận robot của Google DeepMind.

Malde chia sẻ với WIRED rằng một số sản phẩm lập trình AI hàng đầu hiện nay, chẳng hạn như Cursor, đang thực hiện phiên bản sơ khai của việc học tập liên tục — sử dụng dữ liệu thực tế về cách mọi người tương tác với sản phẩm để thực hiện đào tạo sau (post-training) và thường xuyên cải tiến mô hình. Ông lập luận rằng đây là lý do cốt lõi khiến các sản phẩm lập trình AI bùng nổ nhanh chóng, và là một phần lý do khiến các phòng lab AI lớn đã vội vã phát triển các ứng dụng "vibe coding" của riêng họ. Với Trajectory, Malde và đội ngũ 11 nhà nghiên cứu và kỹ sư của mình hy vọng sẽ áp dụng kỹ thuật tương tự để cải thiện các công cụ hỗ trợ AI bên ngoài lĩnh vực lập trình.

"Kể cả những AI mạnh mẽ nhất hiện nay vẫn là tĩnh. Mô hình AI bạn dùng ngày hôm nay sẽ mắc lại những sai lầm giống như ngày hôm qua," Malde nói. "Một vài công ty đang bắt đầu bước vào thế giới của việc học tập liên tục. Những gì chúng tôi đang làm là xây dựng nền tảng để mọi công ty đều có thể đạt được khả năng học tập liên tục đó."

Thách thức khi áp dụng logic này vào các lĩnh vực khác là lập trình dễ dàng kiểm chứng — mã nguồn chạy được hoặc không chạy được — nhưng một số ngành nghề có định nghĩa về sự thành công mơ hồ hơn. Karanam cho rằng một phần những gì nền tảng của Trajectory cung cấp là giúp tối ưu hóa mô hình AI theo nhu cầu cụ thể của doanh nghiệp.

Thay vì bắt đầu từ một mô hình có sẵn (off-the-shelf) của OpenAI hay Anthropic, Trajectory yêu cầu khách hàng bắt đầu với một mô hình mã nguồn mở đã được đào tạo sau (post-trained) cho sản phẩm AI cụ thể mà công ty hướng tới. Đối với Decagon, một khách hàng xây dựng tác nhân hỗ trợ khách hàng bằng AI, Trajectory sẽ ghi lại khi nào AI của họ hoạt động kém hiệu quả — ví dụ, khi một khách hàng muốn trả hàng nhưng bị chuyển cho nhân viên trực tiếp — và sử dụng các trường hợp đó để đào tạo lại mô hình mới thường xuyên mỗi tuần một lần. Trajectory tuyên bố các mô hình được đào tạo sau này đánh bại các mô hình của các phòng lab hàng đầu trong các nhiệm vụ hẹp quan trọng nhất đối với sản phẩm của công ty.

Các giám đốc điều hành doanh nghiệp rất mong muốn sử dụng AI cho nhiều loại nhiệm vụ khác nhau, nhưng để làm điều đó ngày nay, họ thường cần thuê các đội ngũ "kỹ sư triển khai trước" (forward deployed engineers), hoặc các cố vấn và nhân viên kỹ thuật được nhúng trong công ty để giúp xây dựng sản phẩm AI. Các công ty như OpenAI, Anthropic và Palantir đã vội vã lấp đầy nhu cầu này. Elabd cho biết mục tiêu của Trajectory là xây dựng một sản phẩm có thể tự cải thiện để các công ty không cần kỹ sư nội bộ để liên tục khắc phục sự cố hệ thống AI của họ. Startup này cho biết họ đã có khách hàng trong nhiều lĩnh vực khác nhau, bao gồm startup bán hàng doanh nghiệp Clay và startup pháp lý AI Harvey. Mặc dù hiện tại chủ yếu làm việc với các công ty bản địa AI (AI-native), Trajectory dự định sẽ tiếp thị nền tảng của mình cho các công ty thuộc Fortune 500 trong tương lai.

Các nhà phê bình có thể lập luận rằng Trajectory chưa xây dựng được sự học tập liên tục thực sự, ít nhất là không theo nghĩa truyền thống. Sau tất cả, các mô hình của startup này chỉ cập nhật mỗi tuần một lần vào thời điểm hiện tại và vẫn giữ nguyên trạng thái giữa các lần nâng cấp.

Elabd lập luận rằng Trajectory mới chỉ bắt đầu. Ông tuyên bố ngành công nghiệp AI đang chuyển hướng sang một mô hình mới, nơi AI học hỏi từ kinh nghiệm — giống như những gì đang diễn ra trong lĩnh vực lập trình AI. Elabd nói mục tiêu cuối cùng của Trajectory là xây dựng một nền tảng có thể cập nhật mô hình AI của công ty mỗi ngày, hoặc thậm chí thường xuyên hơn.

"Mỗi ngày có thể vẫn chưa đủ. Nó có thể là mỗi giờ, hoặc thậm chí là mỗi lần tương tác," Elabd nói. "Có thể mỗi công ty không chỉ cần một AI, mà bạn có thể đào tạo một AI để học hỏi cho từng người trong mỗi công ty."

Cựu nhân sự Google và Apple thành lập startup Trajectory nhằm giải quyết vấn đề "học tập liên tục" cho AI

Bài viết liên quan