Sau khi làm việc trên Vision Pro, cựu kỹ sư Apple quay lại với điện thoại vì lý do này

30 tháng 4, 2026·6 phút đọc

Mark Drummond, cựu nhân viên Apple từng tham gia phát triển Vision Pro, cho rằng tai nghe AR quá cô đơn và không phù hợp để kể chuyện tương tác. Ông đã thành lập startup Pixi, tập trung vào trải nghiệm thực tế tăng cường (AR) trên điện thoại sử dụng AI trên thiết bị để tạo ra những tấm thiệp chúc mừng sống động.

Sau khi làm việc trên Vision Pro, cựu kỹ sư Apple quay lại với điện thoại vì lý do này

Sau khi làm việc trên Vision Pro, cựu kỹ sư Apple quay lại với điện thoại vì lý do này

Mark Drummond, CEO của Pixi và là một cựu nhân viên Apple, tin rằng tai nghe thực tế ảo (headset) không phải là nền tảng lý tưởng cho các nhà phát triển AR.

Apple Vision ProApple Vision Pro

Khi Mark Drummond còn làm việc tại Apple trên dự án Vision Pro, ông đã có một sự nhận thức đi ngược lại với câu chuyện marketing mà Cupertino đang xây dựng. Drummond từng quản lý nhóm Character Intelligence, đơn vị chịu trách nhiệm tạo ra bản demo "Encounter Dinosaurs" — một trải nghiệm cho phép người dùng nhìn thấy các sinh vật thời tiền sử ngay trước mắt mình trên Vision Pro.

"Chúng tôi đã xây dựng nó với Jon Favreau," Drummond nhớ lại, đề cập đến sự hợp tác lâu dài giữa Apple và đạo diễn của bộ phim The Mandalorian. "Trước khi chúng tôi có thể mang tai nghe xuống Burbank, chúng tôi đã sử dụng iPhone và iPad."

Tại sao điện thoại lại tốt hơn?

Thực tế, VisionOS về cơ bản là một bản phân nhánh của iPadOS, nên việc sử dụng các thiết bị di động để demo hoàn toàn hợp lý. Qua trải nghiệm đó, Drummond nhận ra rằng các thiết bị di động không chỉ là những giải pháp thay thế tạm thời, mà thực tế còn vượt trội hơn headset trong một số khía cạnh.

"Những gì chúng tôi học được khi tìm kiếm sự ngạc nhiên và vui thích với các nhân vật tương tác trong thực tế hỗn hợp là rằng, tai nghe thực sự không phải là thiết bị tốt nhất cho việc này," ông chia sẻ.

"Tôi vẫn nghĩ đó là một phần cứng tuyệt vời," Drummond thừa nhận. Tuy nhiên, ông chỉ ra rằng việc đeo headset có thể tạo ra sự xa lánh, tách người dùng khỏi thế giới thực và những người xung quanh. "Nó hơi cô đơn," Drummond nói. Ngược lại, một ứng dụng AR trên điện thoại giúp việc chia sẻ trở nên dễ dàng hơn nhiều. "Mọi người có thể nghiêng qua vai bạn để xem cùng," ông nói thêm.

Pixi: Thiệp chúc mừng phiên bản AR

Đó là lý do tại sao không lâu sau khi rời Apple vào năm 2023, Drummond đã chuyển sang tập trung hoàn toàn vào các thiết bị di động để kể chuyện AR. Trong hai năm rưỡi qua, ông đã phát triển một ứng dụng AR mới cho iPhone tên là Pixi, ưu tiên trải nghiệm di động trước tiên.

Pixi AR AppPixi AR App

Nói một cách ngắn gọn, Pixi giống như một tấm thiệp chúc mừng qua email nhưng dưới dạng thực tế tăng cường. Khi ra mắt trong vài tuần tới, Pixi sẽ cho phép bất kỳ ai chọn một nhân vật tương tác và một kịch bản, thêm lời chúc cá nhân, rồi gửi nó cho bạn bè qua iMessage hoặc WhatsApp. Khi người nhận mở tin nhắn Pixi, nhân vật sẽ xuất hiện chồng lên môi trường thực tế của họ qua camera và tương tác với họ.

Trong một bản demo gần đây, trải nghiệm AR của Pixi bao gồm một chú mèo hoạt hình và một robot. Chúng có thể kể chuyện cười, chơi cờ caro (tic-tac-toe) hoặc thách thức bạn chơi trò đập chuột (whack-a-mole) ngay trên bàn làm việc.

Sức mạnh của AI trên thiết bị

Thoạt nhìn, điều này có vẻ không quá đột phá nếu bạn từng chơi với các bộ lọc AR của Snapchat hay các ứng dụng ARKit khác. Tuy nhiên, Pixi tích hợp các yếu tố tương tác thú vị nhờ vào trí tuệ nhân tạo.

Ví dụ, chú mèo hài hước sẽ liên tục nói những câu đùa "dở khóc dở cười" cho đến khi ứng dụng phát hiện người xem mỉm cười thông qua camera trước của điện thoại. Sau đó, nhân vật sẽ cảm ơn người xem như một diễn viên kết thúc màn trình diễn và gửi lời chúc cá nhân.

"Để khiến nhân vật cảm thấy như đang hiện diện thực sự, nó phải biết quan sát," Drummond nói. Điều này bao gồm việc không chỉ quan sát người xem mà còn cả môi trường xung quanh. "Loại sự chú ý này chỉ có thể thực hiện được thông qua AI trên thiết bị (on-device AI)."

Pixi sử dụng AI và học máy (Machine Learning) để nhận diện biểu cảm khuôn mặt. Ứng dụng cũng tải xuống các mô hình ML tùy chỉnh để nhận diện các vật thể và đưa chúng vào câu chuyện.

Trong tương lai, Drummond hình dung các thiệp chúc mừng AR của Pixi sẽ thông minh hơn rất nhiều. Ví dụ, bạn gửi một chú chó Golden Retriever đến văn phòng của một người bạn vừa thăng chức. Chú chó sẽ ngửi ngó, đi đến một tủ hồ sơ và tập trung vào một ngăn kéo. Khi người bạn mở ngăn kéo đó ra, họ sẽ tìm thấy một chiếc bánh quy ảo với lời chúc mừng.

Tương lai của AR: Điện thoại hay Kính?

Về mặt kỹ thuật, điều này có thể thực hiện được trên Vision Pro, nhưng có nhiều rào cản khác, đặc biệt là mức giá 3.500 USD. "Nó đắt đỏ," Drummond thừa nhận. Mức giá cao này đã kìm hãm sự phổ biến, với ước tính của IDC cho thấy Apple chỉ xuất xưởng được 45.000 đơn vị trong quý nghỉ lễ năm ngoái.

Ngay cả những người sở hữu Vision Pro cũng có thể ngần ngại đeo nó mỗi khi nhận được một đoạn clip ngắn. "Bạn không lúc nào cũng mang nó bên mình, và còn có chi phí lắp đặt, tháo gỡ," Drummond nói. "Chúng ta luôn mang điện thoại theo bên mình."

Apple được cho là đang phát triển kính thông minh và AR riêng, nhưng Drummond tin rằng các sản phẩm kính này sẽ không thể thay thế smartphone trong nhiều năm tới do các hạn chế về vật lý. Điện thoại hiện nay có khả năng chạy các mô hình máy learning phức tạp ngay trên thiết bị, trong khi kính sẽ bị hạn chế nhiều về năng lượng và khả năng tính toán.

Do đó, các nhà phát triển AR tìm kiếm trải nghiệm giải trí tương tác có thể sẽ thấy điện thoại vẫn là nền tảng tốt nhất trong tương lai gần — một nền tảng ngày càng mạnh mẽ hơn nhờ sự hỗ trợ của AI.

Bài viết được tổng hợp và biên soạn bằng AI từ các nguồn tin tức công nghệ. Nội dung mang tính tham khảo. Xem bài gốc ↗