Startup Human Archive: Đặt cược vào lực lượng lao động tự do tại Ấn Độ để huấn luyện robot
Human Archive, một startup do các cựu sinh viên Berkeley và Stanford thành lập, đang trả tiền cho công nhân tại Ấn Độ để đeo các thiết bị ghi hình và cảm biến nhằm thu thập dữ liệu vật lý thực tế cho các phòng thí nghiệm AI và robot. Công ty vừa huy động thành công 8,2 triệu USD để giải quyết nút thắt thiếu hụt dữ liệu huấn luyện trong ngành công nghiệp robot.

Startup Human Archive: Đặt cược vào lực lượng lao động tự do tại Ấn Độ để huấn luyện robot
Trong vài năm qua, thị trường giao đồ ăn trực tuyến và các dịch vụ tại gia tại Ấn Độ đã tăng trưởng mạnh mẽ, tạo ra một lực lượng lao động tự do (gig economy) khổng lồ. Tận dụng xu hướng này, startup Human Archive có trụ sở tại Thung lũng Silicon đang hợp tác với các công ty dịch vụ để trang bị cho công nhân những chiếc mũ đặc biệt tích hợp camera và cảm biến. Mục tiêu của họ là thu thập dữ liệu video dưới góc nhìn thứ nhất (egocentric) về các công việc hàng ngày, phục vụ cho việc huấn luyện robot và trí tuệ nhân tạo.
Thu thập dữ liệu đa phương thức để huấn luyện AI vật lý
Human Archive được thành lập bởi bốn cựu sinh viên của Đại học Berkeley và Stanford, bao gồm Samay Mani, Rushil Agarwal, Shloke Patel và Raj Patel (CEO). Tất cả đều có nền tảng nghiên cứu sâu rộng về robot học, phần cứng và dữ liệu xúc giác.
Thay vì chỉ dựa vào video đơn thuần, startup này đang phát triển và sử dụng các thiết bị bổ sung như găng tay xúc giác, bộ đồ ghi chuyển động toàn thân (motion capture suit) và camera cổ tay. Các thiết bị này giúp thu thập đồng bộ dữ liệu về chuyển động và lực tác động, kết hợp với dữ liệu hình ảnh RGB-D (hình ảnh màu đi kèm thông tin chiều sâu). Raj Patel cho biết công ty đã phát triển hơn bảy sản phẩm phần cứng khác nhau để thu thập dữ liệu đa dạng và đồng bộ hóa chúng từ nhiều nguồn.
"Không có ai khác trên thế giới có khả năng đồng bộ hóa và thu thập dữ liệu RGB-D từ kính, phản hồi lực, ghi chuyển động toàn thân và dữ liệu camera từ cổ tay và ngực ở quy mô lớn," Zach DeWitt, đối tác tại Wing VC, nhận định.
Huy động vốn và đối mặt với thách thức
Vừa qua, Human Archive đã công bố vòng gọi vốn thành công 8,2 triệu USD từ các nhà đầu tư bao gồm Wing Venture Capital, NVP Capital, Y Combinator và các thiên thần từ OpenAI, Nvidia, Google, Meta. Số vốn này sẽ giúp công ty mở rộng mạng lưới thu thập dữ liệu, hiện đã triển khai hơn 1.000 thiết bị đầu ghi tại nhiều địa điểm khác nhau.
Tuy nhiên, con đường này không trải đầy hoa hồng. Human Archive tiết lộ rằng họ đã bị từ chối bởi nhiều công ty dịch vụ tại gia lớn của Ấn Độ như Pronto và Urban Company. Thậm chí, CEO của Urban Company, Abhiraj Singh Bhal, đã công khai tuyên bố trên mạng xã hội X rằng công ty sẽ không tham gia vào các thỏa thuận loại này. Đáp lại, Raj Patel cho rằng Urban Company sẽ sớm phải thay đổi quyết định nếu không muốn mất vị thế trên thị trường.
Mô hình kinh doanh và vấn đề quyền riêng tư
Để thu thập dữ liệu, Human Archive hợp tác với các startup nhỏ hơn, cung cấp dịch vụ giảm giá cho khách hàng. Khi công nhân đến làm việc, khách hàng sẽ được lựa chọn: trả giá thấp hơn và đồng ý để thu thập dữ liệu, hoặc trả giá đầy đủ để không bị ghi hình. Patel cho biết khách hàng thường hài lòng với lựa chọn đầu tiên vì video ghi lại có thể giúp giải quyết các tranh chấp về chất lượng dịch vụ.
Về phía công nhân, Human Archive trả mức lương cơ bản là 1 USD/giờ cho việc tham gia thu thập dữ liệu. Mặc dù thấp hơn so với một số đối thủ cạnh tranh trả khoảng 2,63 - 4,20 USD/giờ, nhưng đại diện công ty cho rằng sự hiện diện rộng khắp của họ tại Ấn Độ giúp duy trì mức chi phí này.
Tuy nhiên, việc thu thập dữ liệu qua video ghi hình tại nhà riêng của người dùng gây ra nhiều lo ngại về quyền riêng tư. Human Archive khẳng định các hợp đồng thương mại của họ tuân thủ Đạo luật Bảo vệ Dữ liệu Cá nhân Kỹ thuật số (DPDP) của Ấn Độ. Công ty cho biết tất cả dữ liệu đều được ẩn danh và các khuôn mặt trong video đều bị làm mờ. Bộ trưởng Điện tử và Công nghệ thông tin Ấn Độ hiện đang xem xét các cơ chế đồng ý và thực tiễn thu thập dữ liệu của các startup trong lĩnh vực này.
Kế hoạch mở rộng tương lai
Mặc dù tập trung chủ yếu tại Ấn Độ, Human Archive đã bắt đầu mở rộng sang Đông Nam Á và Mỹ. Công ty cũng đang xây dựng một nền tảng để bất kỳ ai cũng có thể tham gia thu thập dữ liệu và kiếm tiền. Tại Mỹ, họ có kế hoạch cung cấp các dịch vụ như dọn dẹp hoặc nấu ăn để đổi lấy dữ liệu huấn luyện, hiện các chương trình này đang ở giai đoạn thí điểm sơ khai.
Trong cuộc đua xây dựng AI vật lý (physical AI), nhu cầu về dữ liệu huấn luyện khổng lồ là yếu tố then chốt. Human Archive đang cạnh tranh để trở thành nhà cung cấp dữ liệu hàng đầu, và sự thành công của họ sẽ phụ thuộc vào việc liệu họ có thể mở rộng quy mô và đảm bảo tính độc đáo của bộ dữ liệu hay không.


