BI đã chết, chào mừng kỷ nguyên mới của Phân tích Dữ liệu
Bài viết phân tích sự chuyển dịch từ Business Intelligence (BI) truyền thống sang kỷ nguyên của các tác nhân AI, nơi việc phân tích dữ liệu không còn là nút thắt cổ chai. Tác giả lập luận rằng tương lai của công nghệ dữ liệu không chỉ nằm ở việc trả lời câu hỏi nhanh hơn, mà là xây dựng một lớp "ý định kinh doanh" giúp hệ thống chủ động phát hiện những thông tin quan trọng mà không cần con người yêu cầu.

Trong 10 năm làm việc trong lĩnh vực dữ liệu, tôi đã chứng kiến một mô hình lặp đi lặp lại nhiều lần: Một công ty công nghệ lớn gặp phải giới hạn kỹ thuật hoặc quy trình. Họ giải quyết vấn đề nội bộ bằng phần mềm hoặc mô hình mới. Họ viết về nó (và có thể mã nguồn mở). Một vài kỹ sư thành lập công ty để bán phiên bản quản lý. Một vài năm sau, ngành công nghiệp chấp nhận nó.
Các ví dụ thì nhiều: Airbnb viết về Airflow năm 2015; Ngăn xếp dữ liệu hiện đại (Modern Data Stack) xuất hiện từ các bài viết về nền tảng dữ liệu nội bộ tại Uber, Netflix; và dbt trở thành tiêu chuẩn cho các nhóm dữ liệu. Mỗi chu kỳ được kích hoạt khi một giới hạn cơ bản được giải quyết hoặc một nguồn lực trở nên sẵn có. Tuy nhiên, trong kỷ nguyên MDS, nút thắt cổ chai không phải là kỹ thuật mà là khả năng phân tích của con người.
AI Agents đã thay đổi cuộc chơi
Khi các tác nhân AI xuất hiện, kịch bản đã bị đảo ngược. Lần đầu tiên, khả năng đặt câu hỏi, khám phá dữ liệu và đưa ra câu trả lời không còn phụ thuộc vào số lượng nhà phân tích hay số lượng dashboard bạn xây dựng. Phân tích dữ liệu không còn là nút thắt cổ chai nữa.
OpenAI, Meta và ClickHouse đều đã công bố các bài viết chi tiết về việc họ chuyển dịch từ phân tích dựa trên dashboard sang sử dụng AI agents làm cơ chế tiêu thụ dữ liệu chính. Điều này làm gián đoạn hoàn toàn quy trình BI & Phân tích mà chúng ta đã quen thuộc. Nhưng trước khi kết luận "BI đã chết", chúng ta cần đặt câu hỏi sâu sắc hơn: Một thế giới với khả năng phân tích miễn phí và không giới hạn sẽ trông như thế nào?
Vấn đề của BI truyền thống
Quy trình làm việc điển hình của BI luôn như sau: Người dùng cần trả lời một câu hỏi -> Tìm dashboard không thấy -> Gửi yêu cầu -> Chờ hai tuần để nhóm dữ liệu xây dựng -> Khi dashboard xong, họ đã chuyển sang việc khác hoặc chỉ nhìn qua một lần mà không có tác động gì.
Vấn đề cốt lõi là BI được xây dựng xung quanh những câu hỏi đã được đặt. Một dashboard là câu trả lời cho một câu hỏi tại một thời điểm cụ thể, được đóng băng trong biểu đồ và có thể không còn phù hợp. Tôi gọi đây là "vấn đề khung cửa kín" (closed-window problem). Trong công cụ BI, bạn chỉ thấy một phần của những gì đang diễn ra, nhưng không bao giờ thấy toàn bộ bức tranh. Công cụ chỉ hiển thị những gì người khác quyết định đo lường, không thể hiện ra những điều không ai nghĩ đến việc hỏi.
Vấn đề chưa được giải quyết: Tôi nên đặt câu hỏi gì?
Các tác nhân AI thế hệ mới (như của Meta, OpenAI) vượt xa Text-to-SQL. Chúng có thể điều hướng ngữ cảnh kinh doanh, lý luận trên tài liệu và mã code, trả lời các câu hỏi phức tạp trong vài phút mà trước đây nhà phân tích phải mất vài ngày.
Tuy nhiên, tôi nghĩ chúng ta đang tối ưu hóa ở sai cấp. Những cải tiến này đều ở bước "làm thế nào để trả lời câu hỏi này?". Câu hỏi trước nó — "tôi nên đặt câu hỏi gì?" — vẫn hoàn toàn do người dùng quyết định.
Khi tôi làm Trưởng sản phẩm tại Sifflet, chúng tôi thấy một hành vi bất ngờ: khách hàng dùng tính năng cảnh báo để theo dõi các chỉ số kinh doanh (tín hiệu rời bỏ, thay đổi nhu cầu...). Họ không dùng để giám sát chất lượng dữ liệu, mà để hiểu những con số nào đang thay đổi và liệu chúng có đáng để hành động hay không. Điều này cho thấy họ cần một hệ thống theo dõi dữ liệu và tự động thông báo khi có gì đó quan trọng thay đổi, mà không cần được yêu cầu.
Mô hình mới: Lớp ý định kinh doanh (Business Intent Layer)
Việc trả lời câu hỏi nhanh hơn chưa bao giờ là phần khó nhất. Khoảng cách thực sự luôn nằm ở thượng nguồn: Biết câu hỏi nào đáng để hỏi. Giải quyết điều này yêu cầu hoạt động ở một lớp hoàn toàn khác: lớp ý định kinh doanh.
Hãy tưởng tượng Công ty A (một công ty SaaS) xác định ba thứ:
- Mục tiêu kinh doanh cốt lõi: Tỷ lệ giữ lại doanh thu ròng (NRR).
- Các chỉ số thúc đẩy nó: Tỷ lệ sử dụng tính năng, số lượng vé hỗ trợ, tần suất đăng nhập...
- Dữ liệu ghi lại các chỉ số trên.
Ngày nay, nhóm sản phẩm có một dashboard đẹp để theo dõi việc sử dụng tính năng. Nhưng nó không chỉ ra rằng các tài khoản có tỷ lệ sử dụng thấp nhất đều có điểm chung trong CRM: họ đều là các công ty quy mô vừa và nhỏ ký hợp đồng vào Q4, khi một đội ngũ bán hàng cụ thể phụ trách hội nhập. Vấn đề hội nhập này sẽ không bao giờ xuất hiện trên dashboard hiện tại.
Một tác nhân hoạt động dựa trên mục tiêu đã định nghĩa (NRR) sẽ có lý do để xem xét dữ liệu sản phẩm, hồ sơ CRM và lịch sử hội nhập đồng thời — và lý do để làm nổi bật các mô hình mà không ai nghĩ đến việc hỏi.
Đây là mô hình: định nghĩa ý định một lần, sau đó để hệ thống giám sát và làm nổi bật những gì quan trọng mà không cần được hỏi.
Điều gì sẽ đến tiếp theo?
Các bài viết từ Meta, OpenAI và ClickHouse là tín hiệu rõ ràng nhất rằng một chu kỳ mới đã bắt đầu. Trong khi làn sóng hiện tại đang giải quyết tuyệt vời cho phân tích tự phục vụ (bất kỳ câu hỏi nào bạn nghĩ ra, được trả lời nhanh hơn), câu hỏi sâu sắc hơn "tôi nên nhìn vào cái gì từ đầu?" vẫn còn mở. Ai trả lời được nó không chỉ đang xây dựng một công cụ BI tốt hơn. Họ đang định nghĩa thế nào là một công ty dựa trên dữ liệu trong kỷ nguyên của các tác nhân.
Đó là lớp giá trị đáng để xây dựng.



