Nga Độc Hóa Wikipedia: Cách Tuyên Truyền Thâm Nhập Vào Các Mô Hình AI

02 tháng 5, 2026·4 phút đọc

Các báo cáo mới đây cho thấy các tác nhân thân Nga đang thao túng Wikipedia để lan truyền thông tin sai lệch, biến nền tảng này thành công cụ cho chiến tranh thông tin. Nguy hiểm hơn, dữ liệu bị "độc hóa" này đang được sử dụng để huấn luyện các chatbot AI, làm sai lệch nhận thức của người dùng toàn cầu về thực tế lịch sử.

Nga Độc Hóa Wikipedia: Cách Tuyên Truyền Thâm Nhập Vào Các Mô Hình AI

Nga Độc Hóa Wikipedia: Cách Tuyên Truyền Thâm Nhập Vào Các Mô Hình AI

Trong kỷ nguyên số, Wikipedia được xem là "tổng hợp kiến thức của nhân loại", là nơi hàng triệu người tìm kiếm thông tin mỗi ngày. Tuy nhiên, một báo cáo mới từ Atlantic Council đã hé lộ một thực tế đáng báo động: các tác nhân nhà nước Nga đang hệ thống hóa việc thao túng nền tảng bách khoa toàn thư này. Không chỉ dừng lại ở việc viết lại lịch sử theo hướng có lợi cho Điện Kremlin, họ còn sử dụng Wikipedia để "làm nhiễm" các mô hình Trí tuệ Nhân tạo (AI), khiến các công cụ công nghệ cao trở thành phương tiện lan truyền tuyên truyền.

Minh họa về sự can thiệp kỹ thuật số và thao túng thông tinMinh họa về sự can thiệp kỹ thuật số và thao túng thông tin

Sự trỗi dậy của các "Tài khoản rối"

Theo nghiên cứu của Viện Đối thoại Chiến lược (ISD), một hoạt động ác ý có tổ chức đã nhắm vào các bài viết tiếng Anh về cuộc chiến Nga-Ukraine và 48 trang liên quan. Các nhà nghiên cứu đã sử dụng phương pháp "phân tích ngữ nghĩa" để phát hiện mạng lưới các tài khoản ảo, hay còn gọi là "sock puppets".

Những tài khoản này hoạt động tinh vi, chỉnh sửa lén lút nội dung để làm giảm tính nghiêm trọng của các hành vi lạm dụng trong quá khứ hoặc tô đẹp hình ảnh của các nhà lãnh đạo Nga. Mục tiêu là khai thác cơ chế nguồn mở của Wikipedia để thay đổi nhận thức của công chúng về các sự kiện địa chính trị quan trọng.

Chiến dịch "Portal Kombat" và sự can thiệp kỹ thuật số

Cơ quan Phòng vệ và Giám sát Chống Can thiệp Kỹ thuật số Nước ngoài của Pháp (VIGINUM) đã công bố báo cáo mang tên "Portal Kombat", phơi bày một mạng lưới gồm 193 trang web tuyên truyền thân Nga. Đáng chú ý, VIGINUM phát hiện rằng các trang web này đang được sử dụng làm nguồn tham khảo cho các bài viết trên Wikipedia.

Cụ thể, một bài viết về tình hình địa chính trị ở Biển Đỏ trên Wikipedia đã bị chèn các liên kết dẫn đến các nguồn tin thân Nga không đáng tin cậy. VIGINUM gọi đây là hành vi "can thiệp kỹ thuật số nước ngoài", nơi các nguồn tin độc hại được đưa vào các nền tảng uy tín để hợp thức hóa các thông điệp sai lệch.

Nguy cơ "Độc hóa" các mô hình AI

Mối đe dọa nghiêm trọng nhất nằm ở việc dữ liệu từ Wikipedia đóng vai trò nền tảng trong việc huấn luyện các Mô hình Ngôn ngữ Lớn (LLM) - công nghệ cốt lõi của các chatbot AI hiện đại như ChatGPT hay các công cụ tìm kiếm AI.

"Khi các chatbot AI tiếp tục phát triển, Nga đang lây nhiễm chúng bằng nội dung do Điện Kremlin thao túng, được thiết kế để ảnh hưởng đến internet toàn cầu, làm méo mó sự hiểu biết của công chúng về các sự kiện và khả năng đưa ra quyết định sáng suốt." — Atlantic Council.

Quá trình này được mô tả như một "tiệm giặt ủi thông tin". Các tài khoản ảo trên Wikipedia trích dẫn từ các trang web giả mạo, và sau đó chính các bài viết Wikipedia này lại trở thành dữ liệu huấn luyện cho AI. Kết quả là khi người dùng hỏi AI về các sự kiện lịch sử hoặc chính trị, họ có thể nhận được những câu trả lời đã bị "nhiễm" bởi định kiến thân Nga mà không hề hay biết.

Tương lai của sự thật trên internet

Vấn đề này đặt ra thách thức lớn về tính minh bạch trong việc huấn luyện AI. Các chuyên gia cảnh báo rằng nếu không có biện pháp kiểm soát nguồn dữ liệu hiệu quả, chúng ta đang để các thế lực thù địch định hình lại thực tế số của mình.

Wikipedia hiện đứng trước áp lực phải tăng cường giám sát các chỉnh sửa và xác minh nguồn tin, trong khi các công ty phát triển AI cần tìm cách lọc bỏ dữ liệu bị thao túng. Cuộc chiến không chỉ diễn ra trên chiến trường thực tế mà còn đang khốc liệt trên mặt trận dữ liệu và thuật toán, nơi sự thật và giả mạo ngày càng khó phân biệt.

Việc bảo vệ tính toàn vẹn của dữ liệu huấn luyện AI không chỉ là vấn đề kỹ thuật, mà còn là yếu tố sống còn để bảo vệ sự minh bạch thông tin và nền dân chủ trong thế kỷ 21.

Bài viết được tổng hợp và biên soạn bằng AI từ các nguồn tin tức công nghệ. Nội dung mang tính tham khảo. Xem bài gốc ↗