Giám đốc Snowflake giải thích lý thuyết "Người Nhện" về quyền truy cập dữ liệu của tác nhân AI

10 tháng 4, 2026·4 phút đọc

Snowflake tin rằng rào cản lớn nhất khi phát triển các tác nhân AI không nằm ở mô hình, mà ở chất lượng và khả năng quản trị dữ liệu. Công ty đang tập trung vào các tiêu chuẩn mở như Apache Iceberg để đảm bảo quyền truy cập dữ liệu an toàn và hiệu quả.

Giám đốc Snowflake giải thích lý thuyết "Người Nhện" về quyền truy cập dữ liệu của tác nhân AI

Giám đốc Snowflake giải thích lý thuyết "Người Nhện" về quyền truy cập dữ liệu của tác nhân AI

Snowflake đang đặt cược rằng nút thắt lớn nhất trong việc xây dựng nhiều tác nhân AI (AI agents) tốt hơn không phải là chính các mô hình, mà là việc liệu dữ liệu mà các tác nhân đó phụ thuộc có sạch sẽ, dễ tiếp cận và được quản trị tốt hay không. Ông James Rowland-Jones, Giám đốc Quản lý Sản phẩm của Snowflake, đã chia sẻ quan điểm này với The Register.

Ông cho biết công ty phân tích dữ liệu này đang tập trung gấp đôi vào các tiêu chuẩn mở để giải quyết vấn đề đó. Ngay sau khi tham dự Hội thượng Apache Iceberg vào tuần này, ông Rowland-Jones cho biết Snowflake đang hướng tới "một ngăn xếp tương tác hoàn chỉnh" được xây dựng xung quanh định dạng bảng mở Apache Iceberg.

Sự hội tụ giữa AI và Dữ liệu

"Bạn về cơ bản có các nền tảng AI được hỗ trợ bởi dữ liệu và các nền tảng dữ liệu được hỗ trợ bởi AI," ông nói. "Nhưng để điều này hoạt động trong kỷ nguyên AI, bạn cần có một bộ dữ liệu mà bạn có thể tiếp cận rất dễ dàng. Và đó là nơi câu chuyện về khả năng tương tác thực sự bắt đầu, bởi vì ngày càng nhiều bạn cần phải có một bản sao duy nhất của dữ liệu."

Việc giảm chi phí token và cải thiện hiệu suất của tác nhân AI phụ thuộc vào việc cung cấp cho các tác nhân một tập hợp ngữ cảnh rõ ràng và mạch lạc. Ông cho rằng điều này chỉ có thể thực hiện được khi dữ liệu có sẵn thông qua một lớp quản trị thống nhất.

Quyền lực lớn đi kèm trách nhiệm lớn

Tuy nhiên, việc mở rộng quyền truy cập dữ liệu cũng đi kèm với những trách nhiệm mới, mà ông gọi là "câu chuyện Người Nhện".

"Nếu tôi cho bạn quyền truy cập trực tiếp vào dữ liệu, bạn cần có khả năng hành động dựa trên dữ liệu đó một cách có trách nhiệm," ông Rowland-Jones nhấn mạnh.

Ông chỉ ra đặc tả danh mục REST của Iceberg và việc sử dụng thông tin xác thực bảo mật của nhà cung cấp làm nền tảng cho những gì ông mô tả là quyền truy cập dữ liệu dựa trên tiêu chuẩn, trung lập về công nghệ.

"Bằng cách đặt nền tảng dữ liệu của bạn trên một định dạng và tiêu chuẩn tương tác như Apache Iceberg, và bạn sử dụng các tiêu chuẩn như Iceberg REST, cũng như các lớp quản trị dựa trên Apache Polaris để tiếp cận dữ liệu, điều bạn đang làm là cho phép khách hàng kết nối các động cơ khác và có quyền truy cập đa người đọc, đa người viết vào dữ liệu đó, trực tiếp, bất kể họ có đi qua động cơ tính toán Snowflake hay không," ông giải thích.

Tầm nhìn "Tương tác mà không phải thỏa hiệp"

Tầm nhìn của Snowflake, theo ông Rowland-Jones, là cho phép truy cập dữ liệu được lưu trữ trong bộ nhớ đối tượng đám mây, như Amazon S3, bất kể động cơ tính toán truy cập nó là của Snowflake hay bên thứ ba như Apache Spark.

"Khả năng tương tác mà không phải thỏa hiệp," ông Rowland-Jones mô tả mục tiêu này là cho phép khách hàng sử dụng các khả năng quản trị của Snowflake đồng thời hỗ trợ các động cơ khác truy cập trực tiếp vào cùng một dữ liệu cơ bản.

Lộ trình của Snowflake bao gồm việc phát hành chung (GA) hỗ trợ Iceberg v3, khả năng đọc và ghi tương tác cho bất kỳ động cơ nào thông qua Snowflake Horizon Catalog và khả năng lưu trữ do Snowflake quản lý cho các bảng Iceberg.

"Chúng tôi rất nhiệt huyết trong việc đảm bảo đóng góp cho cộng đồng Iceberg cũng như hưởng lợi từ nó," ông Rowland-Jones nói. "Chúng tôi tin rằng mã nguồn mở là con đường hai chiều — bạn không thể chỉ tiêu thụ mà không đóng góp."

Ông cho biết Snowflake hiện đang trong giai đoạn dùng thử công khai (public preview) đối với Iceberg v3 và những gì ông gọi là "phạm vi bao quát rộng nhất của đặc tả Iceberg v3" trong số các nhà cung cấp.

"Chúng tôi nhận thấy sự quan tâm rất lớn, không chỉ từ khách hàng của Snowflake mà còn từ toàn bộ hệ sinh thái về việc xem các triển khai này," ông chia sẻ. "Và một ví dụ tốt về điều đó là ngay cả với các nhà cung cấp khác, giờ đây họ có thể kết nối với Snowflake và tiêu thụ Iceberg v3. Vì vậy, chúng tôi đang làm việc rất chặt chẽ với khách hàng và cộng đồng để biến tất cả những điều này thành hiện thực."

Bài viết được tổng hợp và biên soạn bằng AI từ các nguồn tin tức công nghệ. Nội dung mang tính tham khảo. Xem bài gốc ↗