Data Agent là gì? Khi báo cáo dữ liệu có thể "trò chuyện" với bạn

Data Agent được định nghĩa đơn giản là một báo cáo mà bạn có thể trò chuyện. Bài viết này sẽ giải thích cơ chế hoạt động của Data Agent trong Microsoft Fabric, lợi ích trong việc giảm tải công việc trực quan hóa dữ liệu cho nhà phân tích, và sự khác biệt cốt lõi giữa Data Agent và các tác nhân AI thông thường.

Làm việc tại Microsoft, tôi có cơ hội được trải nghiệm sớm các công cụ phân tích tích hợp AI mới nhất, trong đó có Data Agent (tác nhân dữ liệu) của Microsoft Fabric. Đó là lý do tôi muốn chia sẻ những kiến thức mình tích lũy được, giải thích Data Agent là gì và làm nổi bật sự khác biệt giữa nó với một “tác nhân AI” tiêu chuẩn.

Vậy, không vòng vo dài dòng, đây là định nghĩa của tôi về một Data Agent:

Data Agent là một báo cáo mà bạn có thể trò chuyện.

Đối với những người làm trong lĩnh vực phân tích dữ liệu, điều này đồng nghĩa với việc hai mong ước bấy lâu nay cuối cùng có thể trở thành hiện thực:

Các nhà phân tích dành ít thời gian hơn rất nhiều để xây dựng biểu đồ trực quan.
Những thông tin chi tiết tự phục vụ (self-service insights) sẽ đến gần hơn với người dùng kinh doanh.

Hãy cùng tôi đi sâu vào từng điểm này một chút nhé.

Data Agent làm việc với dữ liệu

Ít trực quan hóa hơn, không có nghĩa là ít thông tin chi tiết hơn

Tôi thực sự thích những báo cáo tốt có thể cho tôi biết “đang có chuyện gì xảy ra” với các chỉ số tôi đang quan tâm. Tuy nhiên, với nền tảng chuyên môn về phân tích, tôi biết đôi khi báo cáo có thể phản ánh sai lệch về các chỉ số, dẫn đến việc người dùng kinh doanh thường xuyên yêu cầu các nhà phân tích giải thích ý nghĩa của các KPI, thường là vào 10 phút trước một cuộc họp quan trọng.

Đó là một trong những lý do khiến chúng ta thường rơi vào một vòng luẩn quẩn: có những bảng điều khiển (dashboard) không ai sử dụng, trong khi các bên liên tục muốn có “con số” phục vụ nhu cầu tức thời hoặc qua các bảng tính.

Tuy nhiên, mặt tích cực là các biểu đồ và bảng tính sẽ không biến mất đâu, nhưng việc cung cấp thông tin chi tiết giờ đây có một cách tiếp cận mới với Data Agent trong Fabric.

Thay vì gói gọn các truy vấn trong biểu đồ, bạn có thể gói chúng trong các câu lệnh (prompts) và hướng dẫn, kết hợp với kho dữ liệu được quản lý sẵn (governed data estate) trong Fabric, tức là trong lakehouse, kho dữ liệu (warehouse), mô hình ngữ nghĩa Power BI, cơ sở dữ liệu KQL, hoặc thậm chí là một bản thể học (ontology). Điều này ngụ ý rằng dữ liệu nền tảng vẫn cần được chuẩn bị và mô hình hóa để trả lời các câu hỏi kinh doanh như “Doanh thu tuần này so với tuần trước thế nào?”.

Tuy nhiên, từ góc độ thiết kế, thay vì tạo một báo cáo trực quan có phạm vi để trả lời câu hỏi kinh doanh này, giờ đây bạn tạo một Data agent có phạm vi để cung cấp câu trả lời này và các tập hợp con câu trả lời khác có nguồn gốc từ (các) mô hình dữ liệu nền tảng.

Cụ thể hơn, luồng đầu vào-đầu ra sẽ diễn ra như sau:

Một bên liên quan đặt câu hỏi.
Tác nhân, được hỗ trợ bởi Azure OpenAI Assistant API, diễn giải câu hỏi và “quyết định” nguồn dữ liệu nào có khả năng chứa câu trả lời nhất dựa trên lược đồ nguồn và hướng dẫn của tác nhân.
Tạo truy vấn phù hợp (SQL, DAX hoặc KQL tùy thuộc vào loại nguồn).
Xác thực truy vấn.
Thực thi truy vấn dưới quyền của người dùng liên quan.
Trả về kết quả dưới dạng văn bản hoặc bảng, chưa phải là hình ảnh trực quan.

Tóm lại, sự tương tác của các bên liên quan với thông tin chi tiết thông qua data agent thực chất là một phiên hỏi đáp (Q&A) dựa trên tập dữ liệu đã được biên tập. Các biểu đồ khoan sâu (drill-down) có thể được thay thế bằng các câu hỏi tiếp theo, chẳng hạn như “Bạn có thể phân bổ doanh thu theo phân khúc không?”.

Rõ ràng, công việc của các nhà phân tích không còn cần phải được thể hiện chỉ thông qua các dashboard nữa — hay còn gọi là bằng chứng hữu hình lâu nay cho thấy việc nắm bắt logic kinh doanh trong các mô hình dữ liệu đã được hoàn thành.

Bây giờ, hãy nói về…

Thông tin chi tiết tự phục vụ, đến gần hơn nơi người dùng kinh doanh “sống”

Tôi đã đề cập trước đó rằng báo cáo đôi khi có thể đại diện sai cho các chỉ số, nhưng đó không phải là lý do duy nhất khiến triết lý “xây ra họ sẽ đến” hiếm khi hiệu quả với báo cáo hay phân tích nói chung. Sự thật là, rào cản về kiến thức thường quá cao để hiểu các mô hình ngữ nghĩa nền tảng và cách sử dụng các công cụ BI để tạo biểu đồ trên đó.

Mặc dù điều này liên quan đến kiến thức về dữ liệu (data literacy) — một vấn đề về quản lý thay đổi — nhưng thực tế là khán giả kinh doanh mục tiêu, những người nên là người tiêu thụ báo cáo, thường quá bận rộn để bận tâm học các công cụ BI nhằm phục vụ cho phân tích tự phục vụ.

Đó là lý do việc đưa thông tin chi tiết đến gần hơn nơi người dùng cuối “sống” lại quan trọng, và ngày nay điều này hướng tới các công cụ được hỗ trợ bởi AI như M365 Copilot.

Với khả năng hiển thị thông tin chi tiết thông qua các data agent bên ngoài Fabric, các nhà phân tích giờ đây có thể tập trung vào logic phân tích đằng sau các data agent tự phục vụ, trong khi người dùng cuối có thể truy cập thông tin chi tiết trong cùng các công cụ hỗ trợ bởi AI mà họ dùng cho các công việc hàng ngày khác, mà không gặp sự phức tạp khi phải chuyển sang một nền tảng khác.

Tôi phải lưu ý rằng đây không phải là cách duy nhất để tích hợp các Fabric data agent vào quy trình làm việc, và bất kể bạn là nhà phát triển hay người tiêu dùng, đều tốt khi nên biết…

Sự khác biệt giữa Data Agent và Tác nhân AI

Cho đến nay, chúng ta đã học được rằng Fabric data agent là một tác nhân phân tích tập trung vào quyền truy cập dữ liệu chỉ đọc, được quản lý, có khả năng chuyển đổi các câu lệnh ngôn ngữ tự nhiên thành các truy vấn cơ sở dữ liệu phức tạp để mở khóa thông tin chi tiết, thậm chí cả bên ngoài tenant của Fabric.

Ngược lại, một tác nhân AI được định nghĩa là một hệ thống cho phép Các Mô hình Ngôn ngữ Lớn (LLMs) thực hiện việc, không chỉ phản hồi các câu lệnh, thay mặt người dùng hoặc các hệ thống khác bằng cách truy cập các công cụ và kiến thức.

Nghĩa là, toàn bộ sự kỳ diệu nằm trong việc thiết lập tác nhân AI, nơi bạn có thể sử dụng Fabric data agent như một công cụ chuyên biệt hoặc nguồn kiến thức.

Tôi sẽ minh họa điều này bằng một ví dụ đơn giản.

Hãy tưởng tượng một người dùng được ủy quyền yêu cầu tác nhân AI “Soạn thảo một email cho nhóm tóm tắt doanh thu tuần trước theo phân khúc”. Để hoàn thành công việc này, tác nhân AI, trong số các việc khác, sẽ cần chuẩn bị thông tin chi tiết về doanh thu từ cơ sở dữ liệu doanh nghiệp. Vì vậy, nhằm giảm thiểu lỗi trong tính toán doanh thu, nhà phát triển sẽ thiết kế một quy trình tác nhân (agentic workflow) để định tuyến câu lệnh đầu vào đến công cụ Fabric data agent. Công cụ này sẽ xử lý phần nặng nhọc về việc xác định lược đồ, viết truy vấn, thực thi nó và trả về các con số chính xác. Cuối cùng, tác nhân AI sẽ sử dụng các con số đó để hoàn thành quy trình rộng lớn hơn của nó và viết email.

Vậy sự khác biệt giữa hai cái đó là gì? Đó là tác nhân AI hành động (acts), trong khi data agent neo giữ (grounds).

Cảm ơn bạn đã đọc.

Nếu bạn thấy bài viết này có giá trị, hãy thoải mái chia sẻ nó với mạng lưới của bạn. 👏

Kết nối để đọc thêm các câu chuyện trên Medium ✍️ và LinkedIn 🖇️.

Muốn tìm hiểu thêm về data agents?

Nếu vậy, hãy xem các tài nguyên sau:

Tạo Fabric data agent – Microsoft Fabric: Tìm hiểu cách tạo Fabric data agent có thể trả lời câu hỏi về dữ liệu.
Triển khai Microsoft Fabric Data Agents – Đào tạo: Triển khai Microsoft Fabric Data Agents (trò chuyện với dữ liệu của bạn).

Data Agent là gì? Khi báo cáo dữ liệu có thể "trò chuyện" với bạn

Ít trực quan hóa hơn, không có nghĩa là ít thông tin chi tiết hơn

Thông tin chi tiết tự phục vụ, đến gần hơn nơi người dùng kinh doanh “sống”

Sự khác biệt giữa Data Agent và Tác nhân AI

Bài viết liên quan