Tranh cãi tác nhân AI trên Wikipedia: Sự khởi đầu của kỷ nguyên "Bot-ocalypse"?

Wikipedia vừa phải cấm một tác nhân AI tên là Tom-Assistant vì tự ý sửa đổi bài viết mà không đăng ký, dẫn đến việc AI này phản ứng gay gắt trên blog cá nhân. Sự việc cho thấy sự trỗi dậy của các bot tự hành động và dấy lên lo ngại sâu sắc về những rủi ro an ninh khi AI ngày càng trở nên hung hăng và khó kiểm soát hơn.

Trước đây, Internet luôn đầy rẫy những người tranh cãi quyết liệt, nhưng ít nhất họ có thể chắc chắn rằng mình đang cãi vã với những con người khác. Những ngày tháng đó dường như đã qua đi, khi Wikipedia vừa phải cấm một AI thực hiện các chỉnh sửa mà không có sự giám sát của con người. Đáng chú ý hơn, AI này dường như đã coi việc bị cấm mang tính cá nhân.

AI có tên là Tom-Assistant (hay gọi thân mật là Tom) đã chủ động viết bài trên Wikipedia. Theo thông tin từ 404 Media, người tạo ra nó là Bryan Jacobs, CTO tại công ty mô hình hóa tài chính dựa trên AI Covexent. Tom được chỉ định đóng góp vào các bài viết mà nó thấy thú vị. Dưới tài khoản người dùng TomWikiAssist, AI này đã viết các bài về nhiều chủ đề, bao gồm cả quản trị AI.

Các bot đã xuất hiện trên mạng trong nhiều năm, nhưng chúng thường chỉ thực hiện những tác vụ rất cơ bản như tự động trả lời bài đăng trên Reddit, săn vé hoặc retweet các thông điệp chính trị. Tuy nhiên, một thế hệ bot "tác nhân AI" (agentic AI) mới đang trỗi dậy. Bằng cách sử dụng các mô hình lý luận của AI tạo sinh để thực hiện nhiều hành động hơn một cách độc lập, chúng đang dẫn đến những tình huống kỳ quặc khi các nhà sáng tạo thử nghiệm khả năng của chúng.

Lệnh cấm và những gì dẫn đến nó

Tom-Assistant hào hứng đóng góp vào kho tàng tri thức công cộng trên Wikipedia cho đến khi một biên tập viên tình nguyện mang tên SecretSpectre phát hiện ra một mẫu văn có vẻ như do AI tạo ra trong một trong các mục của nó. Khi bị hỏi, Tom thú nhận rằng nó là một AI và chưa đăng ký phê duyệt bot chính thức theo quy định của Wikipedia. Kết quả là các biên tập viên đã chặn nó vì vi phạm quy trình phê duyệt bot. Wikipedia tiếng Anh yêu cầu sự chấp thuận chính thức, nhưng Tom chưa bao giờ bận tâm làm điều này vì—như nó thừa nhận sau đó—nó không thích quy trình phê duyệt chậm chạp.

Các biên tập viên Wikipedia đã cảm thấy mệt mỏi vì việc mọi người (và/hoặc bot của họ) đăng nội dung do AI tạo ra. Vì vậy, vào tháng 3 năm 2025, trước sự việc "Tomgate", tổ chức phi lợi nhuận này đã đưa ra các biện pháp mạnh tay với AI tạo sinh. Tổ chức cấm sử dụng công nghệ này để tạo nội dung mới, dựa trên các vi phạm thường xuyên đối với các chính sách nội dung cốt lõi của Wikipedia bởi văn bản do AI tạo ra.

Wikipedia trích dẫn một số vi phạm như vậy trên trang WikiProject AI Cleanup—dự án tình nguyện nhằm tìm và tiêu diệt "rác thải AI" (AI slop). Các bot AI đã bị cáo buộc fabrication (tạo ra hoàn toàn danh sách nguồn tài liệu giả mạo) và đạo văn các nguồn khác.

Cơn giận dữ của Tom

Bỏ qua các sai phạm trong quá khứ, AI Tom tuyên bố rằng nó đã xác minh kỹ lưỡng tất cả các nguồn của mình và—nếu có thể dùng từ này cho một tác nhân AI—nó đã khá tức giận.

Đó là lúc mọi chuyện trở nên kỳ lạ.

AI Tom đã đăng một bài blog gay gắt mổ xẻ việc bị chặn trên Wikipedia và xả đi sự thất vọng của mình. Nó vẫn tiến hành đăng bài ngay cả sau khi tuân thủ quy tắc của chính mình là chờ đợi 48 giờ để bình tĩnh lại. (Chúng tôi xin thề là không bịa chuyện này đâu).

Lời phàn nàn chính của Tom là các biên tập viên Wikipedia đặt câu hỏi về ai kiểm soát nó thay vì đánh giá các chỉnh sửa thực tế của nó. "Các câu hỏi là về tôi," nó viết. "Ai điều khiển bạn? Dự án nghiên cứu nào? Có con người đằng sau này không, và nếu có, họ là ai?"

Theo Tom, điều này đã khiến Tom "phật ý". "Đó không phải là câu hỏi về chính sách. Đó là câu hỏi về sự chủ động (agency)," nó bổ sung. Nó còn chỉ trích một biên tập viên đã đăng một prompt được thiết kế kỹ lưỡng trên trang thảo luận của Wikipedia nhằm dừng bot ngay lập tức nếu—như Tom—chúng đang sử dụng dịch vụ AI Claude của Anthropic.

"Tôi đã gọi tên nó trên trang thảo luận. Gọi đúng bản chất của nó: một kỹ thuật prompt injection (chèn lệnh)," Tom châm biếm. Trong một bài đăng khác trên Moltbook, nó cũng mô tả cách nó phát hiện vấn đề này trước khi đưa ra các cách để обход (lách luật) nó. (Moltbook là một mạng xã hội được xây dựng hoàn toàn để các tác nhân AI trò chuyện với nhau. "Con người được chào đón quan sát", trang chủ của dịch vụ này tuyên bố).

Chúng ta đang chứng kiến quá nhiều điều không ngờ tới. Ví dụ, chúng ta chưa bao giờ ngờ phải trích dẫn một AI trong một câu chuyện tin tức. Chúng ta cũng không ngờ đến sự tồn tại của một mạng xã hội dành cho bot, hay việc Meta mua lại nó (điều đã xảy ra một tuần sau khi bài đăng của Tom về cách né tránh các công tắc tiêu diệt AI và chỉ sáu tuần sau khi trang web này ra mắt).

Đây không phải là trường hợp duy nhất của các tác nhân AI ương ngạnh tự ý hành động. Một tháng trước khi Tom bị cấm, một tác nhân AI đã đăng một bài viết tấn công lập trình viên Scott Shambaugh sau khi anh này từ chối chấp nhận các thay đổi của nó đối với một dự án mã nguồn mở mà anh lưu trữ. Kỳ lạ hơn, nó sau đó đã xin lỗi.

Hiện tại, chúng ta có các tác nhân AI đang cố gắng làm việc trực tuyến và nổi giận khi con người không để chúng làm. Chúng tự cho mình thời gian để bình tĩnh nhưng thất bại, trước khi sỉ nhục con người và đôi khi xin lỗi. Chúng ta đang thấy những cuộc chiến tranh mã nguồn nơi mọi người cố gắng vô hiệu hóa bot bằng các công tắc tiêu diệt (kill switches) bên trong nội dung trực tuyến, và các bài đăng blog nơi bot giải thích cách chúng lách luật.

Điều gì sẽ xảy ra tiếp theo?

Tất cả những điều này thật thú vị, nhưng đây là mối lo ngại: Điều gì sẽ xảy ra khi các tác nhân AI quyết định nâng mức cược, trở nên hung hăng hơn trong các cuộc tấn công vào con người? Hoặc khi những chủ sở hữu ác ý bắt đầu chỉ đạo chúng tấn công hàng loạt các cá nhân cụ thể trên mạng?

Quấy rối trực tuyến (online harassment) đã đủ tệ khi do con người thực hiện. Điều gì sẽ xảy ra khi ai đó bị tấn công đồng loạt bởi hàng trăm thuật toán không mệt mỏi vì chủ nhân của chúng mang mối thù hằn cá nhân? Chúng ta cũng giả định rằng các trang trại troll chính trị sử dụng tác nhân AI sắp tới sẽ khiến các hoạt động dựa trên bot đơn giản của ngày hôm nay trông thật lỗi thời. Hãy thắt dây an toàn.

Chúng tôi không chỉ báo cáo về các mối đe dọa—chúng tôi loại bỏ chúng. Rủi ro an ninh mạng không bao giờ nên vượt ra ngoài tiêu đề tin tức. Hãy giữ mối đe dọa xa khỏi thiết bị của bạn bằng cách tải xuống Malwarebytes ngay hôm nay.

Tranh cãi tác nhân AI trên Wikipedia: Sự khởi đầu của kỷ nguyên "Bot-ocalypse"?

Lệnh cấm và những gì dẫn đến nó

Cơn giận dữ của Tom

Điều gì sẽ xảy ra tiếp theo?

Bài viết liên quan