Neuralink có đang đi sai hướng khi chuyển dịch từ điều khiển ý chí sang khôi phục giọng nói?
Elon Musk từng hứa hẹn Neuralink sẽ mang lại khả năng siêu nhân và hợp nhất não bộ với AI, nhưng thực tế đang buộc công ty phải thay đổi hướng đi. Trong khi Neuralink tập trung vào điều khiển con trỏ bằng ý nghĩ, các đối thủ lại đạt được bước tiến lớn hơn trong việc khôi phục giọng nói cho bệnh nhân. Liệu tham vọng lớn của Musk có đang va phải bức tường của giới hạn sinh học và nhu cầu y tế thực tế?

Elon Musk từng vẽ ra một viễn cảnh đầy tham vọng nơi Neuralink mang lại khả năng siêu nhân và sự hợp nhất giữa não bộ với trí tuệ nhân tạo. Ông đã tạo ra một cơn sốt đồn đại xung quanh công nghệ cấy ghép não của mình, vốn có thành công nhất định với con người nhưng để lại những tranh luận về đạo đức trong các thử nghiệm trên động vật. Tuy nhiên, giữa hàng loạt những lời quảng cáo rùm beng, ông vẫn còn xa mục tiêu của mình chừng nào còn xa cả Sao Hỏa. Nguyên nhân nằm ở chỗ tham vọng không ngừng nghỉ của ông một lần nữa lại va phải bức tường của thực tế khoa học.
Vấn đề cốt lõi nằm ở cách giao diện não - máy tính (BCI) chuyển đổi suy nghĩ thành hành động. Các sản phẩm của Neuralink cho đến nay đều là giao diện não-đến-con trỏ, cho phép bệnh nhân điều khiển con chuột bằng ý nghĩ. Trong khi đó, các đối thủ của Neuralink đã vươn lên dẫn đầu với các BCI mới hơn có khả năng chuyển đổi suy nghĩ trực tiếp thành lời nói. Và kết quả cho thấy đây là một hướng đi đầy hứa hẹn, đủ để thuyết phục Neuralink âm thầm đầu tư vào các BCI tập trung vào giọng nói.
Minh họa về công nghệ cấy ghép não của Neuralink
Sự khác biệt giữa các loại BCI
Tất cả các BCI đều kết nối não bộ với máy tính thông qua dây dẫn hoặc Bluetooth. Chúng "theo dõi" các tín hiệu điện nhỏ mà các neuron sử dụng để giao tiếp với nhau, sau đó cố gắng giải mã chúng để dự đoán người dùng muốn làm gì trong tương lai. Sự khác biệt chính giữa các BCI nằm ở loại hành vi mà chúng cố gắng mô phỏng.
Với BCI giọng nói, bệnh nhân nghĩ về việc nói từ "tốt" và từ đó sẽ xuất hiện trên màn hình. Đây không phải là đọc tâm trí — mà là phát hiện những gì họ đang cố gắng nói. Một BCI vận động, loại mà Neuralink đang xây dựng, giúp người dùng điều hướng con trỏ trên màn hình máy tính. Ngược lại, BCI giọng nói chuyển đổi sóng não thành âm thanh và các phần nhỏ của từ gọi là âm vị.
Trong vòng năm năm, BCI giọng nói đã đạt được những cột mốc ấn tượng sánh ngang với thành tựu của công nghệ BCI vận động hai thập kỷ tuổi. Một nghiên cứu năm 2019 báo cáo rằng BCI giọng nói có thể dự đoán những gì một người định nói khi chỉ được cung cấp một vài lựa chọn. Đến năm 2024, một bệnh nhân ALS 45 tuổi có thể nói chuyện tự nhiên với độ chính xác 97% nhờ BCI giọng nói của mình.
Điểm mấu chốt ở đây là: Cả hai phiên bản về mặt kỹ thuật đều là BCI vận động. Khoa học thần kinh cơ bản là giống nhau. Khi bạn cử động ngón tay, não bộ gửi tín hiệu xuống cơ ngón út của bạn. Khi bạn nói chuyện, não bộ gửi các tín hiệu tương tự xuống lưỡi và các cơ khác giúp bạn tạo thành âm thanh. BCI phát hiện cơ mà người dùng đang nghĩ đến việc di chuyển, dù là lưỡi hay ngón tay, và dự đoán những gì họ đang cố gắng làm hoặc nói.
Hình ảnh minh họa so sánh các công nghệ BCI
Neuralink điều chỉnh hướng đi
Neuralink hiện đang sửa chữa để phù hợp với phần còn lại của cộng đồng BCI. Vào tháng 5, Neuralink bắt đầu tuyển dụng bệnh nhân cho một thử nghiệm lâm sàng để nghiên cứu việc khôi phục giọng nói tại Bệnh viện Cleveland Clinic Abu Dhabi ở Các Tiểu vương quốc Ả Rập Thống nhất. Vào tháng 10, công ty đã khởi chạy thử nghiệm khôi phục giọng nói tại Mỹ tại Trung tâm Y tế Đại học Texas Southwestern. Các bệnh nhân sẽ sử dụng cùng một phần cứng với các bệnh nhân Neuralink hiện tại nhưng với mục tiêu chuyển đổi suy nghĩ thành lời nói thay vì chuyển động con trỏ.
Công ty đã tuyên bố thành công trong một video được đăng lên X vào ngày 24 tháng 3 về một người tham gia thử nghiệm BCI giọng nói vẫn có thể nói chuyện nhưng lời nói của họ khó hiểu do bệnh ALS.
BCI giọng nói dường như là tương lai của lĩnh vực này, nhưng vẫn còn phải xem liệu công nghệ này có vượt qua BCI vận động để ra thị trường nhanh hơn hay đơn giản là cung cấp một lựa chọn công nghệ khác cho những bệnh nhân có nhu cầu khác nhau.
Tầm quan trọng của giao tiếp
Matt Angle, CEO của Paradromics — một đối thủ của Neuralink, cho rằng Neuralink đã mắc sai lầm khi tập trung vào BCI vận động. Paradromics bắt đầu hoạt động một năm trước, vào năm 2015, với ưu tiên hàng đầu là giọng nói. Theo góc nhìn của Angle, giọng nói là ứng dụng đầu tiên tốt hơn của công nghệ BCI so với việc khôi phục vận động vì nó mang lại "sự thay đổi chất lượng cuộc sống lớn nhất mà bạn có thể tưởng tượng", đó là "khả năng nói chuyện với những người thân yêu một lần nữa — và đó là điều BCI có thể làm ngay hôm nay".
Tốc độ là yếu tố hạn chế BCI vận động. Một bệnh nhân sử dụng BCI vận động của Neuralink đã mất 1 phút 17 giây để gõ một câu trả lời 16 từ. Nếu mất khả năng giao tiếp và phương thức giao tiếp chính của tôi là BCI, tôi sẽ muốn lấy lại giọng nói, Angle chia sẻ.
Tuy nhiên, không phải bệnh nhân nào cũng có nhu cầu giống nhau. Spero Koulouras, một cựu kỹ sư phần mềm và doanh nhân mắc ALS, cho biết ông ưu tiên BCI vận động "hơn một dặm". Ông giao tiếp hoàn toàn qua máy tính và dành phần lớn ngày để viết mã và thiết kế 3D. BCI giọng nói không thể giúp ông "hoàn toàn hoạt động trong môi trường ảo" của mình. Nhưng ông cũng thừa nhận rằng các buổi họp mặt gia đình là một sự tra tấn khi không thể đùa giỡn với người thân theo thời gian thực.
Thực tế về việc nâng cao con người
Có lẽ sự chia rẽ lớn nhất trong ngành công nghiệp BCI không phải là giọng nói so với vận động, mà là nâng cao khả năng so với hỗ trợ y tế. Tại sự kiện ra mắt năm 2019, Musk đã đặt mục tiêu cuối cùng của Neuralink là "giao diện não-máy tính đầy đủ", mà ông định nghĩa là "một loại cộng sinh với trí tuệ nhân tạo". BCI vận động là những bước đệm cần thiết cho mục tiêu cuối cùng của ông là nâng cao bất kỳ con người nào muốn có BCI để đạt được sự kết hợp AI siêu nhân.
Tuy nhiên, lý thuyết đằng sau việc nâng cao khả năng có một khuyết điểm lớn: Sự tiến hóa đã giới hạn lượng thông tin có thể chảy từ não bộ ra cơ thể. "Trong thực tế, chúng ta bị giới hạn bởi sinh lý học của chính mình," giáo sư Kip Ludwig từ Đại học Wisconsin-Madison cho biết.
Có một giả định sai lầm rằng họ có thể trở nên giỏi đến mức giao diện não-máy tính có thể giải mã từ não bộ nhanh hơn tốc độ chúng ta mã hóa bằng cơ thể tự nhiên như gõ phím hay đánh bóng chày. Ngay cả khi BCI trở nên siêu nhanh trong việc giải mã tín hiệu của não bộ, chúng ta cũng không thể tận dụng tối đa nó. BCI vận động về mặt lý thuyết có thể rút ngắn khoảng 200 mili-giây thời gian phản ứng của một người, nhưng điều đó không thực sự hữu ích cho những người đang cố gắng lấy lại sự độc lập trong các công việc tại nhà.
Thách thức thương mại hóa
Thành công về mặt kỹ thuật không nhất thiết dẫn đến thành công về mặt thương mại. Một trong những thách thức lớn nhất là vấn đề bảo hiểm y tế. Ian Burkhart, một cựu người dùng BCI, cho rằng việc bảo hiểm chi trả cho các thiết bị sử dụng tại nhà luôn là một cơn đau đầu đối với người khuyết tật.
BCI vận động là một thiết bị đặc biệt không có tiền lệ. "Không có lý do y tế nào nói rằng mọi người cần phải có khả năng sử dụng máy tính hoặc sử dụng cánh tay robot... Nhưng có lý do y tế cho việc mọi người có thể truyền đạt chính xác các nhu cầu sức khỏe của họ," ông Burkhart nhận định.
Ngược lại, giọng nói lại có tiền lệ. Số lượng lớn các bộ tạo giọng nói hoặc thiết bị giao tiếp thay thế đã được Cục Quản lý Thực phẩm và Dược phẩm Hoa Kỳ (FDA) phê duyệt và được bảo hiểm chi trả có thể làm cho con đường bồi thường cho BCI giọng nói "sạch sẽ hơn một chút" so với BCI vận động.
Cho đến nay, Neuralink đã cấy ghép cho khoảng 5 đến 12 người kể từ khi bệnh nhân đầu tiên được cấy ghép vào tháng 1 năm 2024. Mặc dù ấn tượng, nhưng Neuralink vẫn tụt hậu so với Blackrock Neurotech với tổng số 52 bệnh nhân. Còn phải xem liệu BCI giọng nói có thể vượt qua các BCI vận động truyền thống dựa trên con trỏ để vươn tới thị trường thương mại hay không. Nhưng điều rõ ràng là giấc mơ về "siêu nhân" đang dần nhường chỗ cho thực tế nhân văn hơn: giúp những người bệnh tìm lại giọng nói của mình.



