SAP thâu tóm Dremio để mở rộng hệ sinh thái dữ liệu và AI

Phần mềm05 tháng 5, 2026·4 phút đọc

Gã khổng lồ phần mềm ERP SAP đã chính thức mua lại Dremio, một công ty chuyên về tích hợp và phân tích dữ liệu, nhằm mở rộng khả năng của các công cụ phân tích và xây dựng tác nhân AI đến các nguồn dữ liệu bên ngoài. Thương vụ này dự kiến sẽ giúp khách hàng loại bỏ sự phân mảnh dữ liệu và nâng cao khả năng tích hợp, biến nền tảng Business Data Cloud của SAP trở thành một lakehouse doanh nghiệp hỗ trợ gốc định dạng bảng mở Apache Iceberg.

SAP thâu tóm Dremio để mở rộng hệ sinh thái dữ liệu và AI

SAP thâu tóm Dremio để mở rộng hệ sinh thái dữ liệu và AI

Gã khổng lồ phần mềm ERP SAP đã chính thức mua lại Dremio, một công ty chuyên về tích hợp và phân tích dữ liệu, nhằm mở rộng khả năng của các công cụ phân tích và xây dựng tác nhân AI đến các nguồn dữ liệu bên ngoài. Thương vụ này dự kiến sẽ giúp khách hàng loại bỏ sự phân mảnh dữ liệu và nâng cao khả năng tích hợp, biến nền tảng Business Data Cloud của SAP trở thành một lakehouse doanh nghiệp hỗ trợ gốc định dạng bảng mở Apache Iceberg.

Mục tiêu thống nhất dữ liệu doanh nghiệp

SAP đã chi một khoản tiền không được tiết lộ để sở hữu doanh nghiệp lakehouse dựa trên Iceberg này. Động thái này nhằm giúp khách hàng giải quyết vấn đề phân mảnh dữ liệu và cải thiện khả năng tích hợp. Theo SAP, thương vụ mua lại sẽ bổ sung hoàn hảo cho nền tảng kho dữ liệu và phân tích Business Data Cloud cũng như SAP HANA Cloud.

Trong một tuyên bố, SAP khẳng định Business Data Cloud sẽ trở thành một "lakehouse doanh nghiệp hỗ trợ gốc Apache Iceberg, thống nhất dữ liệu SAP và không phải SAP để thúc đẩy AI tác nhân ở quy mô doanh nghiệp".

Vai trò của Apache Iceberg

Apache Iceberg là một định dạng bảng mở (open table format) có nguồn gốc từ Netflix. Định dạng này có đối thủ cạnh tranh trực tiếp là Delta Lake của Databricks (một dự án mã nguồn mở dưới sự bảo trợ của Linux Foundation). Tuy nhiên, Databricks gần đây đã nỗ lực làm cho các tiêu chuẩn này tương thích lẫn nhau hơn sau khi mua lại Tabular - công ty được thành lập bởi các tác giả ban đầu của Iceberg.

Cả hai định dạng đều hứa hẹn mang lại khả năng phân tích trực tiếp trên dữ liệu mà không cần tốn chi phí và công sức di chuyển dữ liệu. Điều này tạo nền tảng vững chắc cho phân tích doanh nghiệp, học máy (machine learning) và phát triển các tác nhân AI.

SAP khẳng định Apache Iceberg là định dạng bảng mở tiêu chuẩn của ngành, và Business Data Cloud sẽ hỗ trợ định dạng này một cách "gốc rễ" làm nền tảng, nghĩa là không cần di chuyển dữ liệu hay chuyển đổi định dạng.

Chuyển dịch chiến lược từ Databricks

Đây không phải là lần đầu tiên SAP thực hiện bước đi này. Khoảng ba năm trước, khi đó là CTO Juergen Mueller, đã cam kết giúp khách hàng "tích hợp dữ liệu SAP với dữ liệu không phải SAP từ các ứng dụng và nền tảng bên thứ ba một cách dễ dàng và tự tin", dựa trên sự hợp tác với Databricks.

Vào năm ngoái, SAP đã thắt chặt quan hệ với Databricks để hỗ trợ chia sẻ dữ liệu hai chiều giữa SAP Business Data Cloud và các nền tảng dữ liệu bên thứ ba, sử dụng định dạng bảng mở Delta Lake của Databricks làm phương thức triển khai ban đầu. Thiết lập này sử dụng Delta Sharing của Databricks, ban đầu dựa trên định dạng Delta, mặc dù công ty gần đây đã thông báo hỗ trợ Iceberg.

Dremio được định giá 2 tỷ USD trong vòng gọi vốn 160 triệu USD vào năm 2022. Bất kể SAP đã trả bao nhiêu cho thương vụ này, rõ ràng họ cảm thấy xứng đáng để sở hữu thêm công nghệ dựa trên định dạng bảng mở Apache Iceberg, yếu tố được nhấn mạnh liên tục trong thông báo. Điều này có thể khiến nhiều người tự hỏi về những gì SAP chưa nhận được từ mối quan hệ đối tác với Databricks.

Hiệu quả và khả năng mở rộng

SAP cho biết nền tảng lakehouse của Dremio sẽ "cải thiện đáng kể hiệu quả kinh tế của phân tích doanh nghiệp", cung cấp cách tiếp cận không máy chủ (serverless) và linh hoạt mà không cần cung cấp dung lượng cố định hay trần hiệu suất.

Với thương vụ mua lại này, SAP sẽ cung cấp cho khách hàng một danh mục mở được xây dựng trên Apache Polaris và API Danh mục REST mở Apache Iceberg. Điều này nhằm tạo ra một lớp khám phá và ngữ nghĩa cho SAP Business Data Cloud, hứa hẹn "một điểm truy cập duy nhất cho ngữ cảnh kinh doanh thống nhất: bao gồm ý nghĩa, mối quan hệ, quyền truy cập và dòng dữ liệu" trên toàn bộ dữ liệu doanh nghiệp bên ngoài SAP.

Chia sẻ:FacebookX
Nội dung tổng hợp bằng AI, mang tính tham khảo. Xem bài gốc ↗