Sự trỗi dậy của "rác thải khoa học" AI: Khi trí tuệ nhân tạo đe dọa sụp đổ hệ thống bình duyệt

Các bài báo khoa học do AI tạo ra ngày càng tinh vi và khó phát hiện hơn, gây áp lực khổng lồ lên hệ thống bình duyệt vốn đã quá tải. Xu hướng này không chỉ làm ngập các tạp chí bằng những nghiên cứu kém chất lượng mà còn đặt ra câu hỏi nghiêm trọng về tương lai của uy tín học thuật.

Mùa hè năm ngoái, người hướng dẫn sau tiến sĩ của Peter Degen đã đến gặp ông với một vấn đề bất thường: Một trong những bài báo của ông đang được trích dẫn quá nhiều. Trong giới học thuật, lượt trích dẫn là thước đo giá trị, nhưng lần này có gì đó kỳ lạ. Bài báo được xuất bản năm 2017 đánh giá độ chính xác của một loại phân tích thống kê trên dữ liệu dịch tễ học và trước đó chỉ nhận được vài chục trích dẫn đáng kể. Tuy nhiên, bỗng nhiên nó được tham khảo mỗi vài ngày, hàng trăm lần, trở thành một trong những bài được trích dẫn nhiều nhất trong sự nghiệp của Degen.

Các bài báo khoa học đang bị ngập bởi nội dung do AI tạo ra

Degen, một nhà nghiên cứu sau tiến sĩ tại Trung tâm Khoa học Tái tạo và Tổng hợp Nghiên cứu của Đại học Zurich, đã phát hiện ra rằng các bài báo trích dẫn công trình của ông đều tuân theo một mô hình tương tự. Chúng đều phân tích Nghiên cứu Gánh nặng Bệnh tật Toàn cầu (Global Burden of Disease), một tập dữ liệu công khai. Tuy nhiên, chúng sử dụng tập dữ liệu này để churn ra (sản xuất ồ ạt) một loạt các dự đoán dường như vô tận: từ khả năng đột quỵ ở người trên 20 tuổi, ung thư tinh hoàn ở người trẻ, cho đến tỷ lệ ngã ở người già tại Trung Quốc.

Khi tìm kiếm mã nguồn trên GitHub, Degen đã theo dõi các liên kết và tìm thấy một công ty tại Quảng Châu (Trung Quốc) quảng cáo các hướng dẫn về cách sản xuất nghiên cứu có thể xuất bản trong vòng dưới hai giờ bằng cách sử dụng các công cụ phần mềm và sự hỗ trợ viết bài của AI. Những nghiên cứu này không thực sự tốt, nhưng chúng không sai lầm trắng trợn như các bài báo do AI tạo ra trong quá khứ, khiến chúng khó bị loại bỏ hơn.

Gánh nặng lên hệ thống bình duyệt

"Đây là một gánh nặng khổng lồ đối với hệ thống bình duyệt (peer review), vốn đã ở giới hạn," Degen nói. "Có quá nhiều bài báo được xuất bản và không đủ người bình duyệt. Nếu các mô hình ngôn ngữ lớn (LLM) khiến việc sản xuất hàng loạt bài báo trở nên dễ dàng hơn, hệ thống này sẽ đạt đến điểm vỡ."

Trong thập kỷ qua, xuất bản học thuật đã phải đối phó với các "paper mills" – các công ty chợ đen sản xuất hàng loạt bài báo và bán vị trí tác giả cho các học giả hoặc bác sĩ muốn làm đẹp hồ sơ. AI tạo sinh đã trở thành công cụ đắc lực cho các xưởng này, giúp chúng tạo ra hình ảnh và văn bản hoàn toàn mới để qua mặt các công cụ phát hiện đạo văn. Tuy nhiên, trước đây, các "ảo giác" (hallucinations) đặc trưng của AI vẫn cho phép các nhà xuất bản lý thuyết có thể sàng lọc được.

AI đang thay đổi cách thức vận hành của nghiên cứu khoa học

Nhưng giờ đây, AI đã cải tiến đến mức có thể tạo ra các bài báo thuyết phục gần như hoàn toàn, cho phép các học giả tuyệt vọng tự mình "xào nấu" ra các bài báo. Kết quả là một làn sóng "rác thải khoa học" đe dọa nhấn chìm việc xuất bản, bình duyệt, cấp vốn và toàn bộ hệ thống nghiên cứu.

Matt Spick, giảng viên phân tích dữ liệu y sinh tại Đại học Surrey và phó biên tập của tạp chí Scientific Reports, là người đầu tiên nhận thấy hiện tượng này khi nhận được ba bài báo gần như giống hệt nhau phân tích dữ liệu khảo sát sức khỏe và dinh dưỡng quốc gia NHANES của Mỹ. Ông nhận ra đã có sự bùng nổ đột ngột các bài báo trích dẫn NHANES, mỗi bài tuyên bố tìm ra mối liên hệ giữa các yếu tố ngẫu nhiên, ví dụ như ăn hạt óc chó với chức năng nhận thức hay uống sữa tách béo với trầm cảm.

Khi AI trở thành nhà khoa học tự chủ

Trong những tháng gần đây, các công ty AI đã phát hành một loạt "trợ lý khoa học" tự chủ (agentic science assistants) có khả năng phân tích dữ liệu, đưa ra giả thuyết và viết bài báo nghiên cứu với độ tự chủ cao. Mặc dù đây có thể là bước tiến towards mục tiêu khoa học được AI thúc đẩy, các hệ thống này cũng đi kèm với những rủi ro mới.

Khi thử nghiệm công cụ Prism của OpenAI, Spick và các đồng nghiệp đã cung cấp dữ liệu từ một bài báo đã xuất bản về thời gian chín của cà tím và ớt. Prism đã phân tích dữ liệu, đề xuất một phương pháp thống kê mới và viết toàn bộ bài báo hoàn chỉnh với biểu đồ và trích dẫn chính xác.

"Chúng tôi nhìn nhau như kiểu: 'Chuyện quái gì thế này, đây thực sự là một công việc khá ngon lành!'", Spick nhớ lại. Khác với các bài báo được tạo ra trước đây ông từng gặp, bài này không theo khuôn mẫu và không sử dụng một cơ sở dữ liệu nổi tiếng nào. Nó chỉ mất 25 phút và 50 giây để hoàn thành.

"Tôi thực sự không chắc tại thời điểm nào chúng ta sẽ đột ngột nhận ra rằng nhiều bài viết hơn đang lọt lưới so với chúng ta nghĩ, vì chúng ta không còn dễ dàng phân biệt được sự khác biệt nữa," Spick nói.

Cuộc khủng hoảng của văn hóa "Công bố hoặc bị đào thải"

Vấn đề cốt lõi nằm ở sự bất cân xứng lớn và đang gia tăng giữa thời gian tạo ra công việc mới và thời gian cần thiết để một chuyên gia trong lĩnh vực đó thẩm định nó. Marit Moe-Pryce, biên tập viên quản lý của tạp chí Security Dialogue, cho biết lượng bài nộp đã tăng 100% so với một năm trước. Vấn đề còn nghiêm trọng hơn: Tất cả các bài nộp đều trở nên "khá tốt".

"Vấn đề chính chúng tôi thấy hiện nay là phía lừa đảo và phía học thuật đang hòa quyện vào nhau, tạo thành một khối bài viết xám lớn mà chúng tôi với tư cách là biên tập viên cần ngồi xuống để tìm hiểu: 'Đây là cái gì? Chúng ta có nên chấp nhận nó không?'" Moe-Pryce nói.

Hệ thống bình duyệt vốn đã chật vật dưới áp lực gia tăng của lượng bài nộp, và giờ đây AI lại làm tăng khối lượng này đồng thời khiến những bài viết kém chất lượng khó bị lọc bỏ hơn. Các nhà xuất bản đang phải vật lộn để tìm người bình duyệt. Một cuộc khảo sát của công ty xuất bản Frontiers năm ngoái cho thấy hơn một nửa số nhà nghiên cứu đã sử dụng sự hỗ trợ của AI trong quá trình bình duyệt của chính họ.

"AI hiện nay có khả năng đưa hệ thống xuất bản sụp đổ như chúng ta vẫn biết," Joris van Rossum, giám đốc chương trình của sáng kiến Integrity Hub, nhận định.

Giải pháp cho vấn đề này không hề dễ dàng. Một nghiên cứu được công bố trên tạp chí Nature năm nay cho thấy các nhà khoa học sử dụng AI xuất bản nhiều hơn gấp 3 lần bài báo và nhận được gần gấp 5 lần lượt trích dẫn so với những người không sử dụng. Tuy nhiên, việc chấp nhận AI để sản xuất hàng loạt bài báo có thể gây hại cho khoa học như một nỗ lực tập thể.

Reese Richardson, một nghiên cứu sinh sau tiến sĩ tại Đại học Northwestern, cho rằng: "Cách duy nhất để thoát khỏi tình trạng này là thực sự thay đổi cách doanh nghiệp khoa học trao giải uy tín và cấp nguồn lực. Miễn là chúng ta có cuộc đua chuột siêu cạnh tranh này, nơi năng suất và giá trị của các nhà khoa học được đo lường bằng số lượng bài báo họ xuất bản, hành vi này sẽ tiếp tục được khuyến khích."

Vincent Larivière, tổng biên tập của Quantitative Science Studies, có chẩn đoán tương tự: "Chúng ta cần một cuộc cải cách về những gì thực sự quan trọng trong khoa học. Sự đồng nhất giữa năng suất khoa học và số lượng bài báo đã gây ra hiệu ứng méo mó."

"Tất nhiên chúng ta cần nhiều khoa học hơn," ông nói, "nhưng chúng ta có cần nhiều bài báo hơn không?"

Sự trỗi dậy của "rác thải khoa học" AI: Khi trí tuệ nhân tạo đe dọa sụp đổ hệ thống bình duyệt

Gánh nặng lên hệ thống bình duyệt

Khi AI trở thành nhà khoa học tự chủ

Cuộc khủng hoảng của văn hóa "Công bố hoặc bị đào thải"

Bài viết liên quan