Anthropic công bố framework mã nguồn mở sử dụng AI Claude để tự động phát hiện và vá lỗ hổng bảo mật

Anthropic vừa ra mắt "Defending Code Reference Harness", một bộ công cụ mã nguồn mở giúp các nhà phát triển sử dụng mô hình AI Claude để tự động hóa quy trình phát hiện, xác minh và khắc phục lỗ hổng trong mã nguồn. Framework này cung cấp một quy trình chuẩn từ trinh sát đến vá lỗi, cho phép tùy chỉnh linh hoạt cho nhiều ngôn ngữ lập trình khác nhau.

Anthropic đã chính thức phát hành "Defending Code Reference Harness", một triển khai tham chiếu mã nguồn mở được thiết kế để hỗ trợ việc khám phá và khắc phục lỗ hổng tự động bằng cách sử dụng sức mạnh của mô hình AI Claude. Dự án này là kết quả của những kinh nghiệm thực tế mà Anthropic đúc kết được sau khi hợp tác với các đội ngũ bảo mật tại nhiều tổ chức kể từ khi ra mắt bản xem trước Claude Mythos.

Mục tiêu chính của framework này là cung cấp một lộ trình rõ ràng và các phương pháp tốt nhất (best practices) để các đội ngũ kỹ thuật có thể xây dựng quy trình tìm kiếm lỗ hổng của riêng mình, thay vì bắt đầu từ con số không.

Quy trình hoạt động: Từ trinh sát đến vá lỗi tự động

Điểm nổi bật của Defending Code Reference Harness là quy trình pipeline hoàn chỉnh bao gồm 7 giai đoạn, giúp tự động hóa việc kiểm tra bảo mật phần mềm:

Build (Xây dựng): Biên dịch mục tiêu thành hình ảnh Docker với các công cụ phát hiện lỗi bộ nhớ như ASAN (đối với C/C++).
Recon (Trinh sát): Một tác nhân nhẹ sẽ đọc mã nguồn trong môi trường cách ly mạng để đề xuất phân vùng, xác định các hệ thống con cần tấn công riêng biệt.
Find (Tìm kiếm): Nhiều tác nhân chạy song song, mỗi tác nhân đọc mã nguồn, tạo ra các đầu vào bị lỗi (malformed inputs) và chạy binary cho đến khi gây ra sự cố.
Verify (Xác minh): Một tác nhân grading riêng biệt sẽ tái tạo từng sự cố trong một vùng chứa mới để đảm bảo tính chính xác, chỉ sử dụng dữ liệu PoC (Proof of Concept) từ tác nhân tìm kiếm.
Dedupe (Loại bỏ trùng lặp): Một tác nhân judge so sánh các sự cố đã xác minh với các lỗi đã biết để quyết định xem đó là lỗi mới hay trùng lặp.
Report (Báo cáo): Tạo ra phân tích khả năng khai thác có cấu trúc cho từng lỗi duy nhất, bao gồm chi tiết về mức độ nghiêm trọng.
Patch (Vá lỗi): Tác nhân patch đề xuất bản sửa lỗi, và tác nhân grading xác nhận rằng mã mới biên dịch thành công, PoC cũ không còn gây crash và bộ test vẫn vượt qua.

Tính năng an toàn và tùy biến

Một trong những mối quan tâm lớn khi sử dụng AI để tương tác với mã nguồn là bảo mật. Anthropic đã giải quyết vấn đề này bằng cách sử dụng gVisor sandbox. Quy trình pipeline từ chối chạy các tác nhân tự động bên ngoài môi trường sandbox này trừ khi được người dùng ghi đè một cách rõ ràng. Điều này đảm bảo rằng việc thực thi mã mục tiêu nguy hiểm sẽ được cách ly, ngăn chặn các rủi ro ảnh hưởng đến hệ thống máy chủ.

Mặc dù bộ công cụ tham chiếu này được cấu hình mặc định để tìm kiếm các lỗ hổng bộ nhớ trong C/C++, nhưng cấu trúc của nó mang tính tổng quát. Các nhà phát triển có thể tùy chỉnh logic để áp dụng cho các ngôn ngữ khác hoặc các lớp lỗ hổng khác nhau bằng cách trả lời các câu hỏi như: "Dấu hiệu nào cho thấy một phát hiện?", "PoC trông như thế nào?", và "Mục tiêu được xây dựng và chạy như thế nào?".

Lộ trình triển khai cho đội ngũ phát triển

Anthropic đề xuất một lộ trình "Ramp Up" từng bước để các đội ngũ làm quen nhanh chóng với công cụ:

Ngày 1: Xây dựng mô hình mối đe dọa (threat model) và chạy quét tĩnh + phân loại đầu tiên.
Ngày 2: Chạy pipeline tham chiếu trên một thư viện C/C++ có lỗ hổng đã biết.
Ngày 3-5: Tùy chỉnh pipeline cho mục tiêu riêng của bạn.
Tuần 2: Bắt đầu quy trình quét, phân loại và vá lỗi tự động hoàn toàn trên các dự án thực tế.

Framework này bao gồm các kỹ năng Claude Code tương tác như /quickstart, /threat-model, /vuln-scan, /triage, và /patch để hỗ trợ người dùng trong từng giai đoạn.

Lựa chọn quản lý (Managed Option)

Đối với các tổ chức không muốn tự triển khai và duy trì hệ thống, Anthropic cũng cung cấp Claude Security — một sản phẩm được quản lý (hosted). Sản phẩm này quét kho lưu trữ mã nguồn để tìm lỗ hổng, áp dụng quy trình xác minh đa giai đoạn để giảm dương tính giả và cho phép quản lý các phát hiện thông qua vòng đời của chúng.

Kho lưu trữ mã nguồn mở "Defending Code Reference Harness" hiện đã có sẵn trên GitHub, cho phép cộng đồng kỹ thuật nghiên cứu, tùy chỉnh và tích hợp AI vào quy trình bảo mật phần mềm (DevSecOps) của mình.