Khi AI và truyền thông tổng hợp làm tê liệt khả năng phân biệt thật - giả trên Internet

11 tháng 4, 2026·9 phút đọc

Từ các video tuyên truyền dạng Lego do AI tạo ra đến việc hạn chế dữ liệu vệ tinh, các hệ thống kiểm chứng thông tin đang gặp khó khăn trong việc theo kịp tốc độ lan truyền của truyền thông tổng hợp. Bài viết phân tích sự đảo ngược tín hiệu xác thực, sự trỗi dậy của nội dung AI khó phát hiện và đưa ra các bước cơ bản để người dùng tự bảo vệ mình trước làn sóng tin giả này.

Khi AI và truyền thông tổng hợp làm tê liệt khả năng phân biệt thật - giả trên Internet

Các video tuyên truyền mô phỏng theo phong cách Lego cáo buộc tội ác chiến tranh đang tràn ngập các nền tảng trực tuyến, tương tự như cách Nhà Trắng gần đây cũng chuyển sang sử dụng các đoạn clip teaser đầy ẩn ý và hình ảnh mang tính meme. Đây không chỉ là sự trôi dạt của nội dung, mà là một mặt trận mới trong chiến tranh thông tin, nơi tốc độ, sự mơ hồ và khả năng tiếp cận của thuật toán quan trọng không kém sự chính xác.

Một kênh truyền thông liên quan đến Iran là Explosive News reportedly có thể sản xuất một đoạn video Lego tổng hợp dài hai phút chỉ trong khoảng 24 giờ. Tốc độ chính là điểm mấu chốt. Truyền thông tổng hợp không cần tồn tại mãi mãi; nó chỉ cần lan truyền trước khi quá trình kiểm chứng kịp bắt kịp.

Tháng trước, Nhà Trắng đã thêm vào sự nhầm lẫn này khi đăng hai video "sắp ra mắt" đầy mơ hồ, sau đó gỡ bỏ chúng sau khi các nhà điều tra trực tuyến và các nhà nghiên cứu nguồn mở bắt đầu phân tích. Kết quả thực tế khá bình thường: một đợt quảng bá cho ứng dụng chính thức của Nhà Trắng. Tuy nhiên, sự kiện này cho thấy cách thức truyền thông chính thức đã thẩm thấu thẩm mỹ của các vụ rò rỉ dữ liệu, tính lan truyền viral và sự hấp dẫn đặc thù của nền tảng. Ngay cả khi các tài khoản chính thức áp dụng thẩm mỹ của một vụ rò rỉ, việc đặt câu hỏi xem một hồ sơ là thật hay tổng hợp là động lực phòng thủ duy nhất còn lại.

Thật so với Tổng hợp: Ma sát mới

Trước đây, việc không có dấu vết kỹ thuật số thường là tín hiệu của tính xác thực. Giờ đây, nó có thể ngụ ý điều ngược lại. Sự vắng mặt của một "dấu vết" không còn có nghĩa là nội dung đó là gốc; nó có thể ám chỉ rằng nó chưa bao giờ được chụp qua ống kính thực tế. Tín hiệu đã bị đảo ngược. Sự thật bị tụt hậu; sự tương tác dẫn đầu.

Lưu lượng truy cập tự động hiện nay ước tính chiếm 51% hoạt động internet, tăng tốc nhanh hơn gấp tám lần so với lưu lượng của con người theo Báo cáo chuẩn mực về lưu lượng AI và mối đe dọa mạng năm 2026. Các hệ thống này không chỉ phân phối nội dung, chúng ưu tiên tính lan truyền chất lượng thấp, đảm bảo rằng hồ sơ tổng hợp di chuyển xa trong khi quá trình kiểm chứng vẫn đang cố gắng bắt kịp.

Các nhà điều tra nguồn mở (OSINT) vẫn đang cố gắng giữ vững trận tuyến, nhưng họ đang chiến đấu trong một cuộc chiến về số lượng. Sự trỗi dậy của những người chia sẻ siêu năng động ("super sharers"), thường được hỗ trợ bởi xác thực trả phí, thêm một lớp quyền lực giả mà tình báo nguồn mở truyền thống giờ đây phải điều hướng.

"Chúng ta luôn trong tình trạng đuổi theo kịp ai đó đang bấm nút đăng lại mà không cần suy nghĩ," Maryam Ishani, một nhà báo OSINT chuyên theo dõi xung đột, cho biết. "Thuật toán ưu tiên phản xạ đó, và thông tin của chúng ta sẽ luôn đi sau một bước."

Đồng thời, sự gia tăng của các tài khoản giám sát chiến tranh đang bắt đầu can thiệp vào chính hoạt động báo chí. Manisha Ganguly, người đứng đầu pháp lý hình ảnh tại The Guardian và chuyên gia OSINT điều tra tội ác chiến tranh, chỉ ra sự chắc chắn sai lệch được tạo ra bởi làn sóng nội dung tổng hợp trên Telegram và X.

"Việc xác minh nguồn mở bắt đầu tạo ra sự chắc chắn sai lệch khi nó ngừng là một phương pháp điều tra — thông qua thiên kiến xác nhận, hoặc khi OSINT được sử dụng để xác nhận thẩm mỹ các tài khoản chính thức hoặc cố tình áp dụng sai để phù hợp với các câu chuyện hệ tư tưởng thay vì chất vấn chúng," Ganguly nói.

Trong khi đó, bộ công cụ kiểm chứng đang trở nên khó tiếp cận hơn. Vào ngày 4 tháng 4, Planet Labs — một trong những nhà cung cấp hình ảnh vệ tinh thương mại được tin cậy nhất cho báo chí chiến tranh — đã thông báo sẽ vô thời hạn giữ lại hình ảnh về Iran và khu vực xung đột rộng lớn hơn ở Trung Đông, có hiệu lực hồi tố từ ngày 9 tháng 3, sau yêu cầu từ chính phủ Mỹ.

Phản hồi của Bộ trưởng Quốc phòng Mỹ Pete Hegseth trước những lo ngại về sự chậm trễ này rất rõ ràng: "Nguồn mở không phải là nơi để xác định điều gì đã hoặc chưa xảy ra."

Sự thay đổi này rất quan trọng. Khi quyền truy cập vào bằng chứng hình ảnh sơ cấp bị hạn chế, khả năng xác thực độc lập các sự kiện bị thu hẹp. Và trong khoảng trống hẹp đó, một thứ khác đang mở rộng: AI tạo sinh không chỉ lấp đầy sự im lặng — nó cạnh tranh để định nghĩa những gì được nhìn thấy từ đầu.

AI tạo sinh ngày càng khó phát hiện hơn

Các nền tảng AI tạo sinh đang học hỏi từ sai lầm của mình. Henk van Ess, một huấn luyện viên điều tra và chuyên gia xác minh, cho biết nhiều dấu hiệu nhận biết cổ điển — số ngón tay sai, biển hiệu phản hồi bị méo, văn bản bị biến dạng — phần lớn đã được sửa chữa trong thế hệ mô hình mới nhất. Các công cụ như Imagen 3, Midjourney và Dall·E đã được cải thiện về khả năng hiểu câu lệnh, tính chân thực về nhiếp ảnh và kết xuất văn bản trong hình ảnh.

Nhưng vấn đề khó khăn hơn là những gì van Ess gọi là sự lai tạo (hybrid).

Trong những trường hợp này, 95% hình ảnh là một bức ảnh thật: siêu dữ liệu thật, nhiễu cảm biến thật, vật lý ánh sáng thật. Sự thao túng nằm ở một chi tiết duy nhất — một miếng vá được thêm vào đồng phục, một vũ khí được đặt vào tay, một khuôn mặt được hoán đổi tinh tế. Các trình phát hiện cấp độ pixel thường bỏ qua nó vì chúng đang quét những gì, xét cho cùng, là một hình ảnh chân thực. Phần giả có thể chỉ là một inch vuông.

"Mọi phương pháp cũ đều giả định rằng hình ảnh là hồ sơ của một sự vật nào đó," van Ess nói. "Truyền thông tạo sinh phá vỡ giả định đó từ gốc rễ."

Henry Ajder, một nhà nghiên cứu deepfake và cố vấn AI đã theo dõi truyền thông tổng hợp kể từ năm 2018, đi xa hơn. Ông cho rằng AI không còn rõ ràng nữa, nó được nhúng sâu. Lượng nội dung tổng hợp chất lượng cao hiện đang lưu hành trên mạng nghĩa là kỷ nguyên của các lỗi hiển thị đang kết thúc. Thay thế cho nó là nội dung trông hoàn toàn đáng tin cậy.

Các công cụ được xây dựng để phát hiện nó có những giới hạn riêng của chúng. Ajder nói rằng các hệ thống phát hiện không phải là động cơ của sự thật. Ngay cả những công cụ mạnh nhất cũng thất bại đủ thường để gây hậu quả, và hầu hết trả về điểm số tự tin mà không giải thích cách đạt được điểm số đó. "Công cụ phát hiện không bao giờ nên được sử dụng作为 tín hiệu duy nhất để xác định hành động," Ajder nói.

Cơ sở hạ tầng đó chưa tồn tại ở quy mô lớn. Cho đến khi nó xuất hiện, gánh nặng sẽ chuyển sang nơi khác — lên những người tiêu thụ hình ảnh ngay từ đầu.

Cách xác minh

Van Ess chia nhỏ quy trình thành 5 bước mà bất kỳ ai cũng có thể áp dụng — không phải là sự đảm bảo, mà là những cách để làm chậm sự lan truyền.

  • Tìm kiếm phong cách "Hollywood": Nếu một bức ảnh cảm thấy quá điện ảnh — quá kịch tính, được chiếu sáng quá đều, được bố cục quá hoàn hảo — đó là một tín hiệu. Thảm họa thực tế hiếm khi đối xứng. Nếu mọi người trông như sẵn sàng cho cận cảnh của họ, đó là dấu hiệu nhận biết đầu tiên của bạn.
  • Chạy nhiều tìm kiếm ảnh ngược: Google Lens, Yandex và TinEye mỗi công cụ đưa ra các kết quả khác nhau. Việc không có kết quả trùng khớp không còn chứng minh tính nguyên bản nữa. Nó có thể có nghĩa là hình ảnh chưa bao giờ được chụp thực tế.
  • Phóng to vào các chi tiết lề: Không phải là địa danh chính, mà là biển báo bãi đỗ xe, nắp cống, góc đổ bóng. Những chi tiết ngoại vi này thường là nơi sự không nhất quán xuất hiện — những phần mà không ai tạo ra một bản giả được trả tiền để hoàn thiện.
  • Coi công cụ phát hiện là gợi ý, không phải phán quyết: Điểm số phần trăm không có giải thích không phải là bằng chứng. Các công cụ cho thấy hình ảnh xuất hiện lần đầu ở đâu, hoặc liệu nó có tồn tại trong cơ sở dữ liệu của người kiểm tra sự thật hay không, hữu ích hơn nhiều so với một đánh giá tự tin duy nhất. ImageWhisperer là một công cụ miễn phí kết hợp các tín hiệu này.
  • Tìm "bệnh nhân số 0": Truy tìm hình ảnh về lần xuất hiện sớm nhất của nó. Tài liệu gốc thường đi kèm với một con người — một nhân chứng, một nhiếp ảnh gia, một địa điểm. Nội dung tổng hợp thường xuất hiện không ma sát: ẩn danh, bóng bẩy và đã được định dạng sẵn để chia sẻ.

Ajder, người đã tư vấn cho các công ty bao gồm Adobe và Synthesia, lập luận rằng giải pháp lâu dài không chỉ là phát hiện tốt hơn, mà là nguồn gốc (provenance) — các hệ thống có thể xác minh nguồn gốc thay vì vô cùng đuổi theo cái gì là giả. Cho đến khi cơ sở hạ tầng đó tồn tại ở quy mô lớn, gánh nặng không biến mất — nó chỉ chuyển dịch.

Trong một hệ thống nơi nội dung tổng hợp di chuyển nhanh hơn khả năng kiểm chứng, phòng thủ thực sự duy nhất có thể là hành vi: sự do dự. Một khoảng lặng trước khi đăng lại. Một vài phút xem xét kỹ lưỡng trong một hệ thống được thiết kế để không thưởng cho điều đó.

Bài viết được tổng hợp và biên soạn bằng AI từ các nguồn tin tức công nghệ. Nội dung mang tính tham khảo. Xem bài gốc ↗