Cisco ra mắt công cụ mã nguồn mở giúp xác minh nguồn gốc mô hình AI

Cisco đã công bố Model Provenance Kit, một bộ công cụ mã nguồn mở nhằm giúp các tổ chức giải quyết các rủi ro bảo mật và tuân thủ khi sử dụng mô hình AI bên thứ ba. Công cụ này tạo ra "dấu vân tay" kỹ thuật số để phát hiện các mô hình bị thay đổi trái phép hoặc bị nhiễm độc.

Cisco vừa công bố một công cụ mới có tên là Model Provenance Kit, được thiết kế để hỗ trợ các tổ chức giải quyết các vấn đề tiềm ẩn liên quan đến việc sử dụng các mô hình trí tuệ nhân tạo (AI) từ bên thứ ba.

Hiện nay, các doanh nghiệp thường xuyên tận dụng các mô hình AI có sẵn từ các kho lưu trữ như HuggingFace, nơi có hàng triệu mô hình được chia sẻ. Mặc dù mang lại nhiều lợi ích, nhưng các tổ chức thường không theo dõi kỹ các thay đổi được thực hiện đối với những mô hình này. Hơn nữa, các hướng dẫn về thẻ mô hình (model cards) và siêu dữ liệu thường được duy trì không đồng nhất bởi các nhà phát triển, gây ảnh hưởng đến người dùng cuối.

Cisco chỉ ra rằng các tuyên bố từ nhà phát triển mô hình — bao gồm nguồn gốc, lỗ hổng và thiên kiến trong dữ liệu huấn luyện — thường không được xác minh. Điều này có thể dẫn đến nhiều vấn đề về bảo mật, tuân thủ và trách nhiệm pháp lý. Ví dụ, doanh nghiệp có thể vô tình sử dụng các mô hình bị nhiễm độc (poisoned) hoặc dễ bị thao túng.

AI và Bảo mật

"Nếu không được kiểm soát, những lỗ hổng này sẽ tiếp tục lan truyền, dù chúng ảnh hưởng đến chatbot nội bộ, ứng dụng tác nhân hay công cụ hướng tới khách hàng," Cisco giải thích. "Tương tự, một doanh nghiệp có thể triển khai một mô hình có thiên kiến trong dữ liệu huấn luyện, khiến nó trở thành lựa chọn kém cho trường hợp sử dụng của họ hoặc dễ bị tấn công."

Các lỗ hổng này sẽ được thừa hưởng và tồn tại trong các ứng dụng tạo sinh và tác nhân. Nếu không có thông tin về nguồn gốc (provenance), các tổ chức sẽ không có cách nào dễ dàng để truy xuất sự cố về nguyên nhân gốc rễ, cũng không thể xác định mô hình nào khác trong hệ thống của họ cũng bị ảnh hưởng.

Ngoài ra, việc thiếu thông tin về nguồn gốc khiến việc phản hồi và khắc phục sự cố trở nên khó khăn hơn khi không có cái nhìn sâu sắc về lịch sử dòng dõi của mô hình. Các rủi ro khác bao gồm vấn đề cấp phép và các yêu cầu quy định của chính phủ đối với việc tài liệu hóa việc sử dụng hệ thống AI, cũng như rủi ro về tính toàn vẹn của chuỗi cung ứng khi tổ chức không thể xác minh các tuyên bố của nhà phát triển.

Logo SecurityWeek

Model Provenance Kit mới của Cisco là một bộ công cụ dựa trên Python và giao diện dòng lệnh (CLI). Công cụ này nhằm giải quyết các vấn đề trên bằng cách tạo ra một "dấu vân tay" cho mỗi mô hình dựa trên các tín hiệu siêu dữ liệu, sự tương đồng của bộ mã hóa (tokenizer), và các tín hiệu nhận dạng ở mức độ trọng số (weight-level) như hình học nhúng, các lớp chuẩn hóa và hồ sơ năng lượng.

Công cụ hoạt động ở hai chế độ chính:

Compare (So sánh): Cho phép người dùng so sánh hai mô hình để xác định xem chúng có chung nguồn gốc hay không.
Scan (Quét): Cố gắng tìm nguồn gốc gần nhất cho một mô hình nhất định bằng cách so sánh dấu vân tay của nó với cơ sở dữ liệu dấu vân tay do Cisco biên soạn.

Khi các mô hình liên tục được tinh chỉnh (fine-tuned), chưng cất (distilled), hợp nhất và đóng gói lại, việc theo dõi nguồn gốc trở nên khó khăn hơn và dễ bị che giấu. Cisco cho rằng việc phát hành Model Provenance Kit là một bước đi hướng tới một cách tiếp cận dựa trên bằng chứng cho nguồn gốc mô hình.

Bộ công cụ mã nguồn mở này hiện đã có sẵn trên GitHub, trong khi tập dữ liệu dấu vân tay mô hình cơ bản của Cisco được đăng tải trên Hugging Face.

Cisco ra mắt công cụ mã nguồn mở giúp xác minh nguồn gốc mô hình AI

Bài viết liên quan