Xây dựng hệ thống RAG nhận thức quyền truy cập trên Amazon FSx cho NetApp ONTAP: Khi AI biết "ai được xem cái gì"

Hệ thống RAG truyền thống thường bỏ qua quyền truy cập file, gây rủi ro rò rỉ dữ liệu nhạy cảm trong doanh nghiệp. Bài viết giới thiệu giải pháp Agentic Access-Aware RAG mã nguồn mở, kết hợp Amazon FSx for NetApp ONTAP và Bedrock để đảm bảo AI chỉ cung cấp thông tin dựa trên quyền hạn thực sự của từng người dùng.

Trong môi trường doanh nghiệp, dữ liệu quan trọng thường nằm trên các máy chủ file được bảo vệ chặt chẽ bởi các quy tắc phân quyền như NTFS ACL hay UNIX permissions. Tuy nhiên, khi đưa dữ liệu này vào các hệ thống RAG (Retrieval-Augmented Generation) truyền thống, ranh giới quyền hạn thường bị xóa nhòa.

Điều này tạo ra một nghịch lý lớn: không chỉ khiến dữ liệu mật bị rò rỉ sang những người không có quyền, mà còn làm AI trả lời sai lệch do bị "nhiễu" bởi quá nhiều tài liệu không liên quan. Để giải quyết vấn đề này, một hệ thống mới có tên gọi Agentic Access-Aware RAG đã được phát triển, giúp AI tôn trọng hoàn toàn quyền truy cập ở cấp độ file.

Kiến trúc hệ thống RAG

Bản chất của Access-Aware RAG

Khác với các mô hình RAG thông thường chỉ dựa vào độ tương đồng ngữ nghĩa để tìm kiếm tài liệu, hệ thống này thêm một chiều kích mới: Lọc dựa trên quyền hạn (SID-based permission filtering).

Nguyên lý hoạt động rất đơn giản nhưng hiệu quả:

Người dùng đặt câu hỏi qua giao diện chat.
Hệ thống lấy danh sách định danh bảo mật (SID) của người dùng đó từ DynamoDB.
Bedrock Knowledge Base thực hiện tìm kiếm vector, nhưng mỗi kết quả đều đi kèm metadata về nhóm được phép truy cập (allowed_group_sids).
Ứng dụng sẽ so khớp SID của người dùng với SID của tài liệu.
Chỉ những tài liệu phù hợp mới được chuyển sang AI để tạo câu trả lời.

Kết quả là cùng một câu hỏi, mỗi người sẽ nhận được câu trả lời khác nhau tùy thuộc vào vai trò của họ. Một kỹ sư sẽ thấy tài liệu kỹ thuật chi tiết, trong khi nhân viên kinh doanh chỉ thấy dữ liệu báo cáo công khai.

Giao diện trò chuyện với mức độ truy cập

Cầu nối dữ liệu: S3 Access Points

Một trong những điểm nhấn kỹ thuật của hệ thống là sự tích hợp Amazon FSx for NetApp ONTAP với Bedrock Knowledge Base thông qua S3 Access Points. Điều này tạo ra một kiến trúc nhập dữ liệu liền mạch:

Trước đây, dữ liệu từ ONTAP cần phải sao chép thủ công sang S3 hoặc qua một server trung gian phức tạp.
Nay, Bedrock KB có thể đọc trực tiếp dữ liệu từ volume ONTAP thông qua S3 Access Point mà không cần bản sao trung gian, tiết kiệm thời gian và tài nguyên.

Ngoài ra, hệ thống sử dụng Amazon S3 Vectors làm kho lưu trữ vector mặc định. Đây là một lựa chọn tối ưu chi phí, chỉ tốn khoảng 2-5 USD/tháng so với 700 USD/tháng khi dùng OpenSearch Serverless, phù hợp cho các giai đoạn phát triển hoặc demo.

Đa dạng chế độ xác thực và Agentic AI

Hệ thống hỗ trợ 5 chế độ xác thực linh hoạt, từ Email/Password cơ bản đến các liên minh SAML, OIDC và LDAP. Điều này cho phép doanh nghiệp tích hợp dễ dàng với hệ thống quản lý danh tính hiện có.

Đáng chú ý, hệ thống không chỉ dừng lại ở việc tìm kiếm tài liệu mà còn cung cấp hai chế độ hoạt động:

KB Mode: Tìm kiếm và Q&A tài liệu thông thường có phân quyền.
Agent Mode: Cho phép các tác nhân AI tự động thực hiện các lý do đa bước và thực thi nhiệm vụ tự trị thông qua Bedrock Agents.

Tất cả đều tuân thủ nghiêm ngặt việc lọc quyền hạn ở mức tài liệu.

Giao diện thư mục Agent

Bảo mật đa lớp và Đa ngôn ngữ

Về mặt bảo mật, hệ thống áp dụng 6 lớp bảo mật (Security Layers), từ CloudFront Geo Restriction, AWS WAF cho đến lọc dựa trên SID/UID+GID ở cấp độ dữ liệu.

Một điểm cộng lớn là khả năng đa ngôn ngữ (i18n). Giao diện và tài liệu hỗ trợ 8 ngôn ngữ bao gồm tiếng Nhật, Hàn, Trung (Giản thể/Phồn thể), Pháp, Đức, Tây Ban Nha và tiếng Anh. Điều này đặc biệt quan trọng với các doanh nghiệp đa quốc gia, đảm bảo nhân viên khắp nơi trên thế giới có thể sử dụng công cụ mà không rào cản ngôn ngữ.

Cách triển khai

Toàn bộ bộ mã nguồn là open-source và có thể được triển khai nhanh chóng trên AWS bằng một câu lệnh duy nhất:

npx cdk deploy --all

Đây là một giải pháp hoàn chỉnh cho các doanh nghiệp muốn tận dụng sức mạnh của AI và RAG nhưng vẫn muốn duy trì kiểm soát chặt chẽ về bảo mật và quyền truy cập dữ liệu nội bộ.

Bạn có thể tìm hiểu thêm chi tiết và mã nguồn tại kho GitHub của dự án để trải nghiệm ngay hôm nay.