Anthropic ra mắt Sandbox tự chủ và Plugin bảo mật mới cho Claude

Anthropic vừa giới thiệu hai tính năng bảo mật mới cho nền tảng AI Claude, bao gồm một sandbox tự chủ (self-hosted) và một plugin hỗ trợ bảo mật dành cho lập trình viên. Plugin này được thiết kế để giúp phát hiện và khắc phục lỗ hổng ngay trong quá trình viết code, giúp giảm đáng kể thời gian review bảo mật.

Anthropic vừa công bố hai tính năng bảo mật mới quan trọng cho mô hình AI Claude của mình: một môi trường sandbox tự chủ (self-hosted) và một plugin hướng dẫn bảo mật. Những công cụ này nhằm mục đích nâng cao tính an toàn và kiểm soát cho các nhà phát triển khi tích hợp AI vào quy trình làm việc của họ.

Anthropic Claude

Sandbox tự chủ cho Claude Managed Agents

Tính năng sandbox, hiện đang ở giai đoạn bản beta công khai, được công bố tại sự kiện Code w/ Claude của Anthropic diễn ra ở London tuần này. Theo công ty, các tác nhân Claude Managed Agents giờ đây có thể hoạt động trong một sandbox do người dùng kiểm soát và kết nối trực tiếp với các máy chủ MPC (Multi-Party Computation) riêng tư của họ.

Cơ chế hoạt động của sandbox này tách biệt việc thực thi công cụ và điều phối tác nhân. Cụ thể, việc thực thi công cụ sẽ chuyển sang môi trường do người dùng cấu hình—có thể là hạ tầng riêng của họ hoặc các nhà cung cấp được quản lý như Cloudflare, Daytona, Modal hoặc Vercel. Trong khi đó, vòng lặp tác nhân (agent loop) chịu trách nhiệm điều phối, quản lý ngữ cảnh và khôi phục lỗi vẫn nằm trên hạ tầng của Anthropic.

Anthropic giải thích thêm: "Các chính sách mạng, nhật ký kiểm toán và công cụ bảo mật của bạn sẽ được áp dụng. Các tệp tin và kho lưu trữ mã nguồn không rời khỏi biên mạng của bạn, và bạn kiểm soát kích thước tính toán cũng như hình ảnh thời gian chạy cho các khối lượng công việc tính toán nặng."

Plugin hướng dẫn bảo mật cho Claude Code

Tách biệt với sandbox, Anthropic cũng đã tung ra một plugin hướng dẫn bảo mật dành cho Claude Code. Công cụ này được thiết kế để hỗ trợ các nhà phát triển phát hiện và khắc phục các lỗ hổng bảo mật ngay trong quá trình viết mã.

Plugin hoạt động bằng cách quét tìm các lỗ hổng trên các tệp tin đang được chỉnh sửa, sau khi có các thay đổi do AI tạo ra và tại thời điểm commit (cam kết mã nguồn). Nó phân tích các mẫu mã rủi ro, xem xét toàn bộ các thay đổi (diffs) và kiểm tra ngữ cảnh xung quanh để đảm bảo tính toàn vẹn của mã.

Plugin này hiện có sẵn thông qua thị trường chính thức của Anthropic và đã được công ty sử dụng rộng rãi nội bộ. "Thông qua việc triển khai nội bộ và các điểm chuẩn, chúng tôi ghi nhận sự giảm 30-40% các nhận xét liên quan đến bảo mật trên các Pull Requests (PR) được mở khi sử dụng plugin," công ty cho biết. "Plugin đóng vai trò như một bước kiểm tra sơ bộ nhẹ nhàng, bắt giữ các vấn đề trước khi thực hiện một bài đánh giá mã (code review) toàn diện."

Bối cảnh mở rộng bảo mật doanh nghiệp

Thông báo này diễn ra chỉ một tuần sau khi Anthropic công bố 28 tích hợp mới về bảo mật và tuân thủ doanh nghiệp cho Claude, cho thấy nỗ lực mạnh mẽ của công ty trong việc định vị Claude là lựa chọn an toàn cho các tổ chức lớn.

Với sự kết hợp giữa sandbox tự chủ và plugin bảo mật thông minh, Anthropic đang trao quyền cho các nhà phát triển không chỉ về năng suất mà còn về khả năng kiểm soát rủi ro bảo mật từ giai đoạn đầu của chu trình phát triển phần mềm.

Anthropic ra mắt Sandbox tự chủ và Plugin bảo mật mới cho Claude

Sandbox tự chủ cho Claude Managed Agents

Plugin hướng dẫn bảo mật cho Claude Code

Bối cảnh mở rộng bảo mật doanh nghiệp

Bài viết liên quan