Số lượng lỗ hổng bảo mật thực tế mà Project Glasswing của Anthropic tìm thấy vẫn là một ẩn số

Mặc dù Anthropic tuyên bố mô hình Mythos của mình cực kỳ mạnh mẽ trong việc phát hiện lỗ hổng zero-day, nhưng dự án giới hạn Project Glasswing vẫn chưa cho thấy con số cụ thể về các lỗi bảo mật đã được tìm ra. Một cuộc điều tra trong cơ sở dữ liệu CVE cho thấy có thể chỉ khoảng 40 lỗi được ghi nhận, nhưng không phải tất cả đều liên quan trực tiếp đến dự án này.

Tuần trước, Anthropic đã gây bất ngờ cho thế giới công nghệ khi tuyên bố rằng mô hình mới nhất của họ, Mythos, lại quá giỏi trong việc tìm kiếm lỗ hổng bảo mật (vulnerabilities) đến mức việc phát hành nó rộng rãi sẽ gây ra hỗn loạn. Giờ đây, dưới tên gọi Project Glasswing, hơn 50 công ty và tổ chức được chọn đã được phép thử nghiệm LLM (Mô hình ngôn ngữ lớn) đầy hứa hẹn này để tìm các lỗ hổng bảo mật trong chính sản phẩm của họ. Nhưng câu hỏi đặt ra là: Rốt cuộc họ đã phát hiện ra bao nhiêu vấn đề?

Theo nhà nghiên cứu Patrick Garrity từ VulnCheck, câu trả lời là... có thể là 40. Hoặc có thể là không có gì cả.

Sự mập mờ về số lượng lỗ hổng

Anthropic đã công bố mô hình mới nhất của mình vào ngày 7 tháng 4 và khi đó, công ty cho biết bản xem trước Claude Mythos đã tìm thấy và có thể khai thác các lỗ hổng zero-day "trong mọi hệ điều hành chính và mọi trình duyệt web chính".

Vì việc để loại máy tìm zero-day này tự do hoạt động trong xã hội sẽ gây ra sự hỗn loạn lớn và phá vỡ internet như chúng ta biết - ít nhất là theo tuyên bố của chính công ty AI này - Anthropic thay vào đó cho phép một nhóm khoảng 50 đối tác trong ngành xem trước cỗ máy săn lỗi này. Điều này giúp họ tìm và sửa chữa các lỗi trong công nghệ của mình trước khi những kẻ xấu có cơ hội khai thác.

Sáng kiến xem trước này được gọi là Project Glasswing. Mặc dù chúng ta vẫn chưa biết tất cả những người tham gia, nhưng chúng ta biết rằng họ bao gồm Amazon Web Services, Anthropic, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, Linux Foundation, Microsoft, Nvidia, Palo Alto Networks và Intel.

Khi thảo luận về Project Glasswing, "một câu hỏi luôn được đưa ra", Garrity cho biết trong một bài đăng trên blog vào thứ Tư. "Chính xác thì nó đã tìm thấy, công bố và nhận được những CVE nào?"

Vì vậy, ông đã quyết định lục lọi cơ sở dữ liệu CVE, chứa hơn 327.000 bản ghi CVE, để tìm ra câu trả lời. Garrity đã tìm kiếm trong cơ sở dữ liệu bất kỳ bản ghi nào chứa từ "Anthropic" từ tháng 2 trở đi, sau đó xem xét tất cả các kết quả này.

Kết quả từ cơ sở dữ liệu CVE

Ông tìm thấy 75 bản ghi chứa từ khóa tìm kiếm "Anthropic", nhưng trong số đó, 35 là CVE ảnh hưởng đến các công cụ của Anthropic như Claude Code, MCP Inspector, cũng như các tích hợp bên thứ ba, do đó chúng không phải là lỗi liên quan đến Glasswing. Vì vậy, không có kết quả nào ở đây.

40 bản ghi còn lại được ghi công cho Anthropic hoặc các nhà nghiên cứu liên kết với Anthropic, do đó những cái này có thể là phát hiện của Glasswing, nhưng chúng ta không thể đảm bảo điều đó.

Garrity viết: "Số 40 được chia thành ba nhóm ghi nhận công lao khác nhau: nhóm nghiên cứu cốt lõi của Anthropic, cá nhân Nicholas Carlini, và Calif.io, một công ty nghiên cứu bảo mật độc lập chạy một chương trình gọi là MADBugs (Tháng của các lỗi do AI phát hiện) ghi nhận công việc của họ chung là 'Calif.io hợp tác với Claude và Nghiên cứu Anthropic'."

Phân tích theo nhà cung cấp: 28 trong số 40 CVE nằm trong trình duyệt Firefox của Mozilla, chín cái nằm trong thư viện nhúng SSL/TLS wolfSSL, một cái nằm trong nền tảng phân phối ứng dụng NGINX Plus của F5, và một cái mỗi cái trong hệ điều hành mã nguồn mở FreeBSD và thư viện phần mềm mã nguồn mở OpenSSL.

Chỉ có một CVE được công khai có thể "liên kết trực tiếp" với Glasswing, theo Garrity.

Đó là CVE-2026-4747, một lỗi thực thi mã từ xa (remote code execution) trong FreeBSD. Mặc dù bản ghi CVE ghi nhận "Nicholas Carlini sử dụng Claude, Anthropic" đã tìm thấy và báo cáo lỗi này - không cụ thể là Glasswing - nhưng blog của Anthropic tuần trước đã nhắc đến CVE-2026-4747 và mô tả nó như sau: "Mythos Preview đã hoàn toàn tự động xác định và sau đó khai thác một lỗ hổng thực thi mã từ xa 17 năm tuổi trong FreeBSD cho phép bất kỳ ai có được quyền root trên máy chạy NFS."

Anthropic cũng cho biết bản xem trước Mythos đã tìm thấy một lỗi 27 năm tuổi trong OpenBSD (đã vá), một lỗi FFmpeg 16 năm tuổi và các chuỗi leo thang đặc quyền (privilege escalation) trong nhân Linux. Không cái nào trong số này được gán CVE.

Garrity nói: "Bức tranh toàn cảnh sẽ không được biết cho đến khi có sự công bố công khai và Anthropic đã chỉ ra rằng một báo cáo tóm tắt công khai được dự kiến vào khoảng tháng 7 năm 2026."

Ông cũng đề xuất rằng Anthropic nên "tạo một trang tư vấn bảo mật chuyên biệt nơi các tư vấn bảo mật và công bố lỗ hổng được xuất bản một cách nhất quán, để cung cấp cách cho người tiêu dùng hiểu câu hỏi: những lỗ hổng nào đã được phát hiện bởi nhóm nghiên cứu Anthropic và Project Glasswing?"

Số lượng lỗ hổng bảo mật thực tế mà Project Glasswing của Anthropic tìm thấy vẫn là một ẩn số

Sự mập mờ về số lượng lỗ hổng

Kết quả từ cơ sở dữ liệu CVE

Bài viết liên quan