Anthropic ra mắt khung mã nguồn mở giúp Claude tự động săn lùng và vá lỗi bảo mật

Anthropic vừa công bố "Defending Code Reference Harness", một khung tham chiếu mã nguồn mở cho phép sử dụng AI Claude để tự động hóa quy trình phát hiện, xác minh và khắc phục lỗ hổng bảo mật trong phần mềm. Công cụ này cung cấp một pipeline hoàn chỉnh từ trinh sát đến vá lỗi, được thiết kế để chạy trong môi trường sandbox an toàn.

Anthropic đã chính thức công bố "Defending Code Reference Harness", một khung tham chiếu mã nguồn mở (open-source framework) được thiết kế để hỗ trợ các nhà phát triển và chuyên gia bảo mật sử dụng mô hình AI Claude trong việc tự động phát hiện và khắc phục các lỗ hổng bảo mật.

Dựa trên kinh nghiệm thực tế từ việc hợp tác với các đội ngũ bảo mật tại nhiều tổ chức kể từ khi ra mắt Claude Mythos Preview, Anthropic đã xây dựng một giải pháp toàn diện giúp tự động hóa quy trình bảo mật phần mềm.

Tổng quan về Defending Code Reference Harness

Đây là một bản triển khai tham chiếu (reference implementation) cho quy trình phát hiện và khắc phục lỗ hổng tự chủ. Mặc dù kho lưu trữ này không được duy trì chính thức như một sản phẩm thương mại, nó cung cấp nền tảng vững chắc để các đội ngũ kỹ thuật xây dựng pipeline của riêng mình.

Anthropic cũng cung cấp tùy chọn quản lý thông qua sản phẩm "Claude Security" – một dịch vụ được lưu trữ giúp tìm và sửa lỗi trên nhiều dự án. Tuy nhiên, đối với những người muốn tùy biến sâu, mã nguồn mở trên GitHub cho phép tích hợp với các API của Claude (bao gồm cả AWS Bedrock, Google Vertex AI hoặc Azure).

Quy trình hoạt động: Từ trinh sát đến vá lỗi

Khung công cụ này triển khai một pipeline bảo mật khép kín với 7 giai đoạn chính:

Build (Xây dựng): Biên dịch mục tiêu thành hình ảnh Docker với các công cụ phát hiện lỗi bộ nhớ như ASAN (đối với C/C++).
Recon (Trinh sát): Một tác nhân nhẹ đọc mã nguồn trong vùng chứa bị cô lập và đề xuất phân vùng, xác định các hệ thống con cần tấn công riêng biệt để tránh trùng lặp.
Find (Tìm kiếm): Nhiều tác nhân chạy song song, mỗi tác nhân đọc mã nguồn, tạo đầu vào bị lỗi và chạy tệp nhị phân cho đến khi gây ra sự cố.
Verify (Xác minh): Một tác nhân grading riêng biệt tái tạo từng sự cố trong vùng chứa mới để xác nhận tính hợp lệ.
Dedupe (Loại bỏ trùng lặp): Một tác nhân thẩm định so sánh các sự cố đã xác minh với các lỗi đã biết để quyết định xem đó là lỗi mới hay trùng lặp.
Report (Báo cáo): Tác nhân báo cáo viết phân tích khả năng khai thác có cấu trúc cho từng lỗi duy nhất.
Patch (Vá lỗi): Tác nhân vá lỗi đề xuất bản sửa lỗi, và tác nhân grading xác nhận rằng mã mới biên dịch thành công, không còn bị lỗi và các bài kiểm tra vẫn vượt qua.

Tính an toàn và Sandbox

Một trong những điểm nhấn quan trọng của dự án này là tính bảo mật. Pipeline tự chủ (bao gồm cả lệnh vá lỗi trên kết quả pipeline) thực thi mã mục tiêu và từ chối chạy bên ngoài môi trường sandbox gVisor trừ khi được người dùng ghi đè một cách rõ ràng.

Các kỹ năng tương tác như /quickstart, /threat-model, /vuln-scan và /triage chỉ đọc và ghi tệp, nên chúng an toàn khi chạy không có sandbox, miễn là người dùng xem xét và phê duyệt từng thao tác công cụ trong Claude Code.

Lộ trình triển khai cho các đội ngũ

Anthropic đề xuất lộ trình 4 bước để các đội ngũ bảo mật làm quen và áp dụng công cụ này:

Ngày 1: Xây dựng mô hình đe dọa (threat model) và chạy quét tĩnh + phân loại đầu tiên.
Ngày 2: Chạy pipeline tham chiếu trên một thư viện C/C++ có lỗ hổng đã biết.
Ngày 3-5: Tùy chỉnh pipeline cho mục tiêu của riêng bạn (port sang ngôn ngữ khác như Java, Python...).
Tuần 2: Bắt đầu quy trình quét, phân loại và vá lỗi tự động trên quy mô lớn.

Tùy biến cho các ngôn ngữ và stack khác nhau

Mặc dù pipeline tham chiếu được thiết kế để tìm lỗ hổng bộ nhớ trong mã C và C++, cấu trúc của nó là chung chung. Người dùng có thể chuyển đổi (port) sang các lớp lỗ hổng hoặc ngôn ngữ khác bằng cách xác định:

Dấu hiệu của một phát hiện (ví dụ: exception, callback DNS thay vì crash signature).
Khái niệm về khái niệm kiểm chứng (PoC).
Cách xây dựng và chạy mục tiêu trong vùng chứa.

Đối với các đội ngũ muốn bắt đầu nhanh, Anthropic khuyến nghị nên bắt đầu nhỏ vào Ngày 1 và xây dựng dần dựa trên những bài học thực tế thay vì dành nhiều tháng để thiết kế một pipeline hoàn hảo ngay từ đầu.