AI chăm sóc sức khỏe bùng nổ: Tiềm năng và rủi ro từ sự thiếu hụt kiểm định độc lập
Microsoft và Amazon vừa tung ra các công cụ AI hỗ trợ sức khỏe dựa trên mô hình ngôn ngữ lớn (LLM), tiếp nối sau các sản phẩm của OpenAI và Anthropic. Dù nhu cầu sử dụng rất cao, các chuyên gia y tế và kỹ thuật số cảnh báo rằng sự thiếu hụt các bài kiểm định độc lập và nghiêm ngặt có thể dẫn đến những hậu quả nghiêm trọng cho người dùng.

Bùng nổ công cụ AI hỗ trợ sức khỏe
Gần đây, Microsoft đã ra mắt Copilot Health, không gian mới trong ứng dụng Copilot cho phép người dùng kết nối hồ sơ y tế và đặt câu hỏi về sức khỏe. Chỉ vài ngày trước đó, Amazon cũng thông báo Health AI, công cụ dựa trên mô hình ngôn ngữ lớn (LLM), sẽ được phát hành rộng rãi. Các sản phẩm này gia nhập hàng loạt các giải pháp khác như ChatGPT Health của OpenAI và Claude của Anthropic.
“Y tế AI cho đại chúng đã chính thức trở thành một xu hướng,” như nhận định từ các chuyên gia trong bài viết.
Sự bùng nổ này xuất phát từ nhu cầu cấp thiết. Nhiều người gặp khó khăn trong việc tiếp cận các hệ thống y tế truyền thống, trong khi các công cụ AI này cung cấp sự hỗ trợ 24/7 mà không phán xét.
Những rủi ro tiềm ẩn
Mặc dù các chuyên gia như Andrew Bean (Oxford Internet Institute) cho rằng các mô hình này có thể mang lại lợi ích lớn, họ nhấn mạnh rằng cơ sở bằng chứng thực nghiệm vẫn còn thiếu thốn.
Nghiên cứu của Mount Sinai Health System đã chỉ ra rằng ChatGPT đôi khi tư vấn quá nhiều cho các bệnh nhẹ hoặc bỏ sót các trường hợp cấp cứu. Dù các công ty có đưa ra các lời cảnh báo về việc không dùng cho chẩn đoán, nhưng người dùng thường xuyên bỏ qua các thông báo này và vẫn tìm kiếm lời khuyên từ các bot này.
Kiểm định độc lập là chìa khóa
Các công ty như OpenAI và Microsoft đang tự kiểm định sản phẩm của mình thông qua các tiêu chuẩn nội bộ như HealthBench. Tuy nhiên, các chuyên gia cho rằng điều này chưa đủ vì thiếu tính khách quan.
Việc thiếu các bài kiểm định do bên thứ ba thực hiện là một vấn đề lớn. Các nghiên cứu với con người thực tế (như nghiên cứu của Google với AMIE) cho thấy tiềm năng, nhưng vẫn chưa được công bố rộng rãi. Để đảm bảo an toàn, cộng đồng nghiên cứu cần huy động nguồn lực để xây dựng các tiêu chuẩn đánh giá chung và đáng tin cậy.



