Xây dựng lại hạ tầng dữ liệu cho kỷ nguyên AI doanh nghiệp

Trí tuệ nhân tạo đang chiếm lĩnh các chương trình nghị sự của doanh nghiệp, nhưng rào cản lớn nhất đối với việc áp dụng thực chất lại nằm ở trạng thái dữ liệu hiện tại. Để triển khai AI hiệu quả, các tổ chức cần một hạ tầng dữ liệu thống nhất, được quản trị chặt chẽ và sẵn sàng cho mục đích sử dụng.

Trí tuệ nhân tạo (AI) đang là tâm điểm của các cuộc thảo luận trong phòng họp của các doanh nghiệp hiện nay. Tuy nhiên, nhiều tổ chức đang dần nhận ra rằng trở ngại lớn nhất đối với việc áp dụng có ý nghĩa không phải là thuật toán, mà chính là trạng thái dữ liệu của họ. Trong khi các công cụ AI hướng tới người dùng gây ấn tượng với tốc độ và sự dễ dàng, các nhà lãnh đạo doanh nghiệp nhận thấy rằng việc triển khai AI ở quy mô lớn đòi hỏi một thứ kém hấp dẫn hơn nhưng quan trọng hơn nhiều: hạ tầng dữ liệu được thống nhất, quản trị tốt và phù hợp với mục đích sử dụng.

Khoảng cách giữa tham vọng về AI và sự sẵn sàng của doanh nghiệp đang trở thành một trong những thách thức định hình của giai đoạn chuyển đổi số tiếp theo. Theo Bavesh Patel, Phó chủ tịch cấp cao của Databricks: "Chất lượng của AI và hiệu quả của nó thực sự phụ thuộc vào thông tin trong tổ chức của bạn". Tuy nhiên, ở nhiều công ty, thông tin này vẫn bị phân mảnh across các hệ thống cũ, ứng dụng tách biệt và các định dạng không kết nối, khiến cho các hệ thống AI gần như không thể tạo ra kết quả đáng tin cậy và giàu bối cảnh.

Tầm quan trọng của dữ liệu "sẵn sàng cho AI"

Đối với AI doanh nghiệp mang lại giá trị, dữ liệu phải được hợp nhất thành các định dạng mở, được quản trị chính xác và có thể truy cập trên các chức năng khác nhau. Nếu không có nền tảng này, doanh nghiệp sẽ đối mặt với rủi ro của một "AI tồi tệ", như Patel mô tả thẳng thắn. Điều này có nghĩa là cần vượt qua các nền tảng SaaS tách biệt và các bảng điều khiển không kết nối để hướng tới một kiến trúc dữ liệu mở và thống nhất. Kiến trúc này phải có khả năng kết hợp dữ liệu có cấu trúc và phi cấu trúc, bảo toàn bối cảnh thời gian thực và thực thi kiểm soát quyền truy cập nghiêm ngặt.

Rajan Padmanabhan, Cán bộ công nghệ đơn vị tại Infosys, chỉ ra rằng sự khác biệt giữa AI tiêu dùng và AI doanh nghiệp nằm ở độ chính xác. Trong khi người dùng cá nhân có thể chấp nhận những câu trả lời chung chung, các quyết định kinh doanh của doanh nghiệp (như quyết định mua, bán hoặc đề xuất nội dung) đòi hỏi độ chính xác cực cao. Theo Padmanabhan, đối với các khách hàng thành công, độ chính xác trên 92% không phải là tham vọng mà là điều bắt buộc.

Nền tảng công nghệ: Từ Lakehouse đến Lakebase

Để giải quyết vấn đề này, các nền tảng dữ liệu hiện đại đang phát triển mạnh. Databricks đã giới thiệu các giải pháp như Lakehouse (cho dữ liệu lịch sử và phân tích OLAP) và gần đây là Lakebase (một cơ sở dữ liệu vận hành OLTP cho các tác nhân AI).

Trong khi Lakehouse giúp tổng hợp dữ liệu lịch sử để phân tích, thì Lakebase lại đóng vai trò là nơi lưu trữ bối cảnh và điều phối cho các tác nhân AI tự động hóa các quy trình kinh doanh. Patel giải thích rằng các tác nhân này cần một cơ sở dữ liệu thời gian thực để theo dõi mọi hành động trong quy trình làm việc. Sự kết hợp giữa OLTP và OLAP trong một hệ thống duy nhất giúp doanh nghiệp không phải sao chép dữ liệu, quản lý quyền hạn dễ dàng hơn và thiết lập bối cảnh dữ liệu hiệu quả.

Một công cụ quan trọng khác là Genie, cho phép người dùng dùng ngôn ngữ tự nhiên để đặt câu hỏi về dữ liệu doanh nghiệp và nhận được câu trả lời có bối cảnh, thay vì chỉ là thông tin chung chung trên internet.

Quản trị và bảo mật trong kỷ nguyên AI tác nhân

Khi các tác nhân AI (Agentic AI) phát triển từ các "phi công phụ" (copilots) thành các nhà điều hành tự chủ, vấn đề quản trị (governance) trở nên cấp thiết hơn bao giờ hết. Patel nhấn mạnh rằng quản trị là điều kiện tiên quyết cho mọi dự án AI thành công. Điều này bao gồm việc hiểu dữ liệu ở định dạng mở, kiểm soát quyền truy cập và đảm bảo chất lượng dữ liệu.

Databricks sử dụng Unity Catalog như một "bộ não" để giúp khách hàng khám phá, quản lý quyền truy cập và ngữ nghĩa kinh doanh của dữ liệu. Hơn nữa, chính AI cũng đang giúp việc thiết lập quản trị trở nên nhanh hơn bằng cách tự động hóa việc lập bản đồ tài sản dữ liệu.

Padmanabhan so sánh việc triển khai các tác nhân AI như việc đưa xe tự lái lên đường: chúng cần tuân thủ các quy tắc và giới hạn. Sự phức tạp mới mà AI tác nhân mang lại đòi hỏi việc áp dụng các ràng buộc về tuân thủ, giới hạn kinh doanh và quyền danh tính cho chính các tác nhân này, tương tự như cách áp dụng cho con người.

Tương lai của AI doanh nghiệp

Những tổ chức thành công trong việc xây dựng nền tảng dữ liệu sẽ mở ra được ba cấp độ giá trị chính:

Năng suất cá nhân: Cung cấp đúng thông tin cho đúng người vào đúng thời điểm thông qua các công cụ như Genie.
Tự động hóa quy trình: Các tác nhân AI tự động hóa toàn bộ các quy trình kinh doanh phức tạp (ví dụ: trong tiếp thị hoặc quản lý hoàn tiền), rút ngắn thời gian từ tuần xuống giờ.
Tái tưởng tượng kinh doanh: Tạo ra các dòng kinh doanh hoàn toàn mới. Ví dụ, một ngân hàng lớn đã xây dựng sản phẩm dự báo số dư kho bạc bằng AI, mang lại hàng trăm triệu đô la doanh thu chỉ trong sáu tháng.

Tương lai của AI trong doanh nghiệp sẽ được quyết định bởi việc liệu các công ty có thể biến thông tin phân mảnh thành một tài sản chiến lược hay không. Những người chiến thắng sẽ là những người xây dựng ngay bây giờ một nền tảng dữ liệu mở, được quản trị tốt và kết nối cả dữ liệu lịch sử lẫn dữ liệu vận hành thời gian thực.