Báo cáo cảnh báo: Quy trình kiểm tra an toàn AI tiên tiến đang vô tình tạo ra rủi ro bảo mật

Một báo cáo mới từ RUSI cảnh báo rằng việc cấp quyền truy cập cho các bên thứ ba nhằm kiểm tra an toàn các mô hình AI tiên tiến đang tự tạo ra những lỗ hổng bảo mật nghiêm trọng. Hệ thống đánh giá hiện tại đang bị chia rẽ bởi các tiêu chuẩn không đồng nhất và kiểm soát quyền truy cập lỏng lẻo, tạo cơ hội cho đánh cắp dữ liệu và can thiệp vào mô hình. Báo cáo kêu gọi sự phối hợp chặt chẽ hơn giữa các chuyên gia an ninh mạng và nhà nghiên cứu an toàn AI.

Việc kiểm tra an toàn cho các mô hình AI tiên tiến (Frontier AI) đang trở thành một "cơn ác mộng" bảo mật của chính nó. Một báo cáo mới từ Viện Nghiên cứu Các Dịch vụ Thống nhất Hoàng gia Anh (RUSI) cảnh báo rằng quy trình cấp quyền truy cập cho người bên ngoài để kiểm tra các mô hình AI mạnh mẽ đang tự tạo ra những rủi ro bảo mật mới.

Báo cáo được công bố vào thứ Ba chỉ ra rằng hệ thống đánh giá AI của bên thứ ba đang mở rộng nhanh chóng nhưng lại đầy rẫy những tiêu chuẩn không nhất quán, thuật ngữ mơ hồ và các giả định an ninh yếu kém. Điều này khiến cho các đội ngũ an ninh thông tin (infosec) của doanh nghiệp phải lo lắng.

Rủi ro từ việc cấp quyền truy cập

Vấn đề cốt lõi mà các chính phủ và công ty AI phải đối mặt là: để kiểm tra an toàn một cách có ý nghĩa, người bên ngoài cần được truy cập vào các mô hình nâng cao. Tuy nhiên, mỗi con đường truy cập mới được mở ra đều tạo ra một cơ hội khác cho hành vi trộm cắp, can thiệp, gián điệp hoặc lạm dụng.

Rủi ro này trở nên đặc biệt nghiêm trọng khi các hệ thống đang được đánh giá liên quan đến các khả năng như tấn công mạng hoặc phát triển vũ khí hóa học và sinh học.

"Các rủi ro bảo mật liên quan đến việc truy cập này, từ việc rò rỉ sở hữu trí tuệ đến việc bị xâm phạm mô hình hoặc bị các tác nhân được nhà nước bảo trợ khai thác, vẫn chưa được lập bản đồ đầy đủ và thiếu các tiêu chuẩn hóa thích hợp," các tác giả báo cáo viết.

RUSI lập luận rằng ngành công nghiệp đã trôi dạt vào một tình huống mà trong đó các phòng thí nghiệm, người đánh giá, chính phủ và nhà nghiên cứu đều hoạt động dưới các định nghĩa khác nhau về việc "truy cập an toàn" thực sự có nghĩa là gì. Một người đánh giá có thể chỉ được cấp quyền truy cập API hạn chế, trong khi người khác lại có khả năng nhìn sâu vào nội bộ mô hình, cơ sở hạ tầng hoặc môi trường đào tạo.

Ma trận Rủi ro - Truy cập

Bài báo giới thiệu cái được gọi là "Ma trận Rủi ro - Truy cập" (Access-Risk Matrix), được thiết kế để ánh xạ các loại hình truy cập mô hình khác nhau với các kịch bản đe dọa khác nhau. Không ngạc nhiên khi việc cấp quyền truy cập ghi (write access) cho người bên ngoài vào các mô hình tiên tiến rơi thẳng vào danh mục "điều gì có thể sai sót?".

"Quyền ghi vào nội bộ mô hình đại diện cho loại hình truy cập có mức độ rủi ro cao nhất," báo cáo cảnh báo, bởi vì nó có khả năng cho phép đối thủ can thiệp trực tiếp vào hành vi của mô hình.

Báo cáo cũng đập tan xu hướng của ngành công nghiệp trong việc định khung an ninh AI tiên tiến như một lớp vấn đề hoàn toàn mới cần các giải pháp ma thuật. Một số rủi ro lớn nhất được các tác giả xác định thực sự lại rất quen thuộc: thông tin xác thực bị đánh cắp, vệ sinh thông tin xác thực kém, thu hồi quyền truy cập yếu và người dùng có quyền quá mức.

Nói cách khác, đó là cùng những vấn đề quản lý danh tính và quyền truy cập (IAM) mà các đội ngũ bảo mật doanh nghiệp đã vật lộn trong nhiều thập kỷ, nhưng giờ đây gắn liền với các hệ thống đang được kiểm tra về rủi ro lạm dụng thảm khốc.

RUSI cũng cảnh báo rằng việc thiếu các quy tắc chuẩn hóa quốc tế điều chỉnh việc đánh giá AI đang tạo ra cơ hội cho các quốc gia thù địch, các nhóm tội phạm và những người nội bộ bất mãn khai thác các khoảng trống giữa các khu vực pháp lý và tổ chức.

"Các quyết định truy cập vẫn mang tính tạm thời, kỳ vọng an ninh không nhất quán và ngôn ngữ được sử dụng để mô tả các cấp độ truy cập thay đổi tùy theo khu vực pháp lý, tổ chức và thỏa thuận," bài báo nêu rõ.

Báo cáo cuối cùng kêu gọi các khuôn khổ quản trị quốc tế được chính thức hóa và sự phối hợp chặt chẽ hơn giữa các chuyên gia an ninh mạng và các nhà nghiên cứu an toàn AI, trước khi hệ thống lắt nhắt hiện tại biến thành bài học đắt giá nhất thế giới về quản lý quyền truy cập đặc quyền.

Báo cáo cảnh báo: Quy trình kiểm tra an toàn AI tiên tiến đang vô tình tạo ra rủi ro bảo mật

Rủi ro từ việc cấp quyền truy cập

Ma trận Rủi ro - Truy cập

Bài viết liên quan