Tính năng Tìm kiếm Tệp trong Gemini API giờ đã hỗ trợ Đa phương thức: Xây dựng RAG hiệu quả và có thể kiểm chứng
Google vừa công bố ba cập nhật quan trọng cho công cụ Tìm kiếm Tệp (File Search) trong Gemini API, bao gồm hỗ trợ đa phương thức, siêu dữ liệu tùy chỉnh và khả năng trích dẫn cấp trang. Những cải tiến này giúp các nhà phát triển xây dựng hệ thống RAG mạnh mẽ hơn, xử lý cả văn bản và hình ảnh một cách chính xác.

Tính năng Tìm kiếm Tệp trong Gemini API giờ đã hỗ trợ Đa phương thức: Xây dựng RAG hiệu quả và có thể kiểm chứng
Google vừa công bố ba bản cập nhật lớn cho công cụ Tìm kiếm Tệp (File Search) trong Gemini API: hỗ trợ đa phương thức, siêu dữ liệu tùy chỉnh và trích dẫn cấp trang. Những tính năng mới này được thiết kế để giúp các nhà phát triển cấu trúc hóa dữ liệu phi cấu trúc, từ đó xây dựng các hệ thống RAG (Retrieval-Augmented Generation - Tạo sinh tăng cường truy xuất) hiệu quả và có thể kiểm chứng cao hơn.
Gemini API File Search
Dù bạn đang xây dựng một dự án cuối tuần hay vận hành một ứng dụng sản xuất cho hàng ngàn người dùng, hệ thống RAG của bạn giờ đây có thể xử lý và tổ chức dữ liệu văn bản cũng như hình ảnh một cách nguyên bản.
Trao cho ứng dụng "bộ nhớ hình ảnh"
Tìm kiếm Tệp hiện nay đã có khả năng xử lý hình ảnh và văn bản cùng lúc. Được hỗ trợ bởi mô hình Gemini Embedding 2, công cụ này hiểu được dữ liệu hình ảnh gốc, mang lại cho các tác nhân AI (AI agents) khả năng nhận biết ngữ cảnh hình ảnh.
Hãy tưởng tượng một công ty sáng tạo đang cố gắng tìm kiếm một tài sản hình ảnh cụ thể. Thay vì dựa vào các từ khóa hay tên tệp, ứng dụng của bạn giờ có thể tìm kiếm trong toàn bộ kho lưu trữ để tìm ra một hình ảnh khớp với tông cảm xúc hoặc phong cách thị giác được mô tả bằng ngôn ngữ tự nhiên trong bản yêu cầu.
Hỗ trợ đa phương thức
Lọc nhiễu với siêu dữ liệu tùy chỉnh
Việc đổ hàng loạt tệp vào cơ sở dữ liệu thì dễ dàng, nhưng việc tìm đúng tài liệu ở quy mô lớn mới là thách thức thực sự. Siêu dữ liệu tùy chỉnh cho phép bạn gắn các nhãn dạng khóa-giá trị (key-value) vào dữ liệu phi cấu trúc của mình — ví dụ như: phòng_ban: Pháp chế hoặc trạng_thái: Hoàn tất.
Bằng cách áp dụng bộ lọc siêu dữ liệu tại thời điểm truy vấn, ứng dụng của bạn có thể giới hạn phạm vi yêu cầu vào đúng phần dữ liệu cần thiết. Điều này giúp giảm thiểu đáng kể sự nhiễu loạn từ các tài liệu không liên quan, đồng thời tăng tốc độ và độ chính xác cho quy trình làm việc RAG.
Hiển thị nguồn gốc với trích dẫn trang
Khi ứng dụng của bạn trích xuất một câu trả lời từ một tệp PDF khổng lồ, người dùng cần xác minh chính xác xem câu trả lời đó đến từ đâu.
Trích dẫn nguồn
Tìm kiếm Tệp giờ đây liên kết phản hồi của mô hình trực tiếp với nguồn gốc ban đầu. Nó ghi lại số trang cho mọi thông tin được lập chỉ mục. Mức độ chi tiết này cho phép bạn dẫn người dùng đến đúng vị trí cần tìm, giúp xây dựng lòng tin và làm cho công cụ của bạn trở nên hữu ích ngay lập tức cho việc kiểm chứng sự kiện một cách nghiêm ngặt.
Bắt đầu với Tìm kiếm Tệp
Google muốn việc lưu trữ và truy xuất dữ liệu trở nên dễ dàng nhất có thể để biến các ý tưởng của bạn thành hiện thực. Công cụ Tìm kiếm Tệp sẽ xử lý các hạng mục hạ tầng nặng nhọc để bạn có thể tập trung vào việc xây dựng sản phẩm.
Việc tải lên tệp và tìm kiếm trên chúng rất đơn giản. Bạn có thể tìm thêm các đoạn mã trong hướng dẫn dành cho nhà phát triển và tài liệu API của Gemini để tìm hiểu cách xây dựng với Tìm kiếm Tệp.
Bài viết liên quan

Công nghệ
Cerebras, đối tác thân thiết của OpenAI, sẵn sàng cho đợt IPO kỷ lục định giá tới 26,6 tỷ USD
04 tháng 5, 2026

Công nghệ
Microsoft giới thiệu Surface Pro 12 và Surface Laptop 8: Sức mạnh chip Intel, giá thành gây sốc
19 tháng 5, 2026
Công nghệ
Trang web ngăn chặn tự tử tại Hà Lan bị phát hiện chia sẻ dữ liệu người dùng cho các công ty công nghệ
13 tháng 5, 2026
