Tại sao AI doanh nghiệp thường trả lời sai một cách tự tin? Lớp ngữ cảnh (Context Layer) là giải pháp then chốt
Các tác nhân AI doanh nghiệp đang gặp vấn đề về độ chính xác do thiếu định nghĩa dữ liệu chung giữa các hệ thống. Snowflake đã giới thiệu giải pháp gồm hai lớp là Horizon Context và Cortex Sense nhằm cung cấp ngữ cảnh được quản lý và thống nhất, giải quyết vấn đề "ảo giác" trong kiến trúc truy xuất dữ liệu lai.
Các tác nhân AI (AI agents) trong doanh nghiệp đang gặp phải một "chế độ thất bại" mới trong sản xuất, và vấn đề này không nằm ở mô hình AI. Khi các doanh nghiệp chuyển từ kiến trúc RAG (Retrieval-Augmented Generation) đơn lớp sang kiến trúc truy xuất lai (hybrid retrieval), cùng một dữ liệu nền tảng lại tạo ra những câu trả lời khác nhau tùy thuộc vào tác nhân, công cụ hoặc hệ thống nào đặt câu hỏi.
Ví dụ, khái niệm "Doanh thu" (Revenue) có nghĩa là một điều trong bảng điều khiển thông minh kinh doanh (BI dashboard), một ý nghĩa hơi khác trong bảng SQL, và lại là một khái niệm khác trong hướng dẫn của tác nhân AI. Việc xây dựng cơ sở hạ tầng truy xuất trong hai năm qua đã tạo ra khả năng tìm kiếm vector nhanh hơn và rẻ hơn, nhưng nó không tạo ra một định nghĩa chung về ý nghĩa của dữ liệu.
Tại hội nghị thượng đỉnh Snowflake Summit 26 ở San Francisco, nhà cung cấp đám mây dữ liệu này đã đưa ra một giải pháp toàn diện cho vấn đề đó. Ẩn sau tất cả các thông báo mới là một lớp ngữ cảnh (context layer): Horizon Context và Cortex Sense. Đây là hệ thống hai lớp được thiết kế để cung cấp cho các tác nhân AI một định nghĩa logic nghiệp vụ được quản lý và chia sẻ trên toàn bộ các ngăn xếp truy xuất.
"Có rất nhiều công cụ ngoài kia mà bạn có thể đặt câu hỏi, bạn sẽ nhận được một câu trả lời rất tự tin, nhưng liệu nó có đúng hay không thì lại là một chuyện khác," Christian Kleinerman, Phó Chủ tịch Sản phẩm tại Snowflake, nhận định.
Từ logic nghiệp vụ phân mảnh đến lớp ngữ cảnh được quản trị
Vấn đề mà Horizon Context nhắm đến rất cụ thể. Logic nghiệp vụ ngày nay được phân tán trên SQL, bảng điều khiển BI và hướng dẫn của tác nhân AI, và không có hệ thống nào sở hữu định nghĩa duy nhất. Khi nhiều tác nhân hoặc công cụ truy vấn cùng một dữ liệu nền tảng, chúng suy luận dựa trên các lược đồ khác nhau và trả về các câu trả lời khác nhau. Horizon Context là nỗ lực của Snowflake nhằm khắc phục điều này ở tầng danh mục (catalog layer) thay vì ở tầng tác nhân.
Horizon Context. Đây là lớp do khách hàng quản lý, được xây dựng dựa trên thương vụ mua lại Select Star của Snowflake. Nó kéo siêu dữ liệu (metadata) từ Postgres, SQL Server, Tableau và Power BI vào Horizon Catalog, để mọi tác nhân, công cụ BI và hệ thống bên ngoài đều sử dụng cùng một định nghĩa được quản trị thay vì suy luận độc lập dựa trên lược đồ vật lý thô. Semantic View Autopilot tự động tạo và tinh chỉnh các chế độ xem ngữ nghĩa theo thời gian, mở rộng logic nghiệp vụ được tuyển chọn mà không cần nỗ lực thủ công liên tục.
Cortex Sense. Đây là lớp có nguồn gốc từ nền tảng. Nó tự động xây dựng và làm phong phú ngữ cảnh từ dữ liệu khách hàng và mô hình sử dụng theo thời gian, mà không cần yêu cầu viết chế độ xem ngữ nghĩa thủ công. Kleinerman mô tả đây là bước cải thiện trải nghiệm mặc định trước khi bất kỳ sự tuyển chọn rõ ràng nào diễn ra.
Sự phân biệt giữa hai lớp này mang tính kiến trúc và Kleinerman rất chính xác về điều này.
"Hãy coi Horizon Context là mọi thứ rõ ràng và được tuyên bố bởi khách hàng, còn Cortex Sense là bất cứ điều gì ngầm định và được chúng tôi suy ra," Kleinerman nói.
Hai lớp này kết nối với cơ sở hạ tầng truy xuất hiện có của Snowflake. Cortex Search, triển khai RAG của công ty, được cắm vào cả CoCo và Cowork như một công cụ, do đó ngữ cảnh được làm phong phú bởi một trong hai lớp sẽ chảy vào quy trình làm việc truy xuất.
Mặc dù Horizon Context là công nghệ của Snowflake, nhưng mục tiêu là để nó có thể tương tác và mở. Snowflake đang gắn kết công nghệ này với Open Semantic Interchange, giúp các định nghĩa do khách hàng tuyên bố có thể di chuyển qua các danh mục và công cụ của bên thứ ba.
"Horizon Context, 100% chúng tôi cam kết và dẫn đầu nỗ lực để đảm bảo rằng điều đó không bị khóa chặt," Kleinerman khẳng định.
Lớp ngữ cảnh xuất hiện khắp nơi. Câu hỏi là cái nào thực sự hiệu quả?
Snowflake đang gia nhập một lĩnh vực ngày càng đông đúc của các nhà cung cấp đang nhắm đến cùng một vấn đề. Microsoft đã mở bản thể kinh doanh Fabric IQ của mình thông qua MCP để bất kỳ tác nhân nào của nhà cung cấp nào cũng có thể rút ra từ một lớp ngữ nghĩa chia sẻ. Redis đã ra mắt Iris, một nền tảng ngữ cảnh và bộ nhớ nằm giữa các tác nhân và dữ liệu của chúng. Pinecone đang định vị lại từ cơ sở dữ liệu vector sang công cụ kiến thức (knowledge engine) với Nexus, biên soạn dữ liệu doanh nghiệp thành các tạo phẩm cụ thể theo nhiệm vụ trước khi các tác nhân truy vấn chúng.
Devin Pratt, giám đốc nghiên cứu tại IDC, cho biết theo quan điểm của ông, Snowflake đang đi đúng hướng và đang đi đến nơi mà toàn bộ thị trường đang hướng tới.
"Các tác nhân chỉ tốt bằng dữ liệu và ngữ nghĩa đằng sau chúng, vì vậy lớp ngữ cảnh, không phải là mô hình, mới là thứ cần theo dõi ngay bây giờ," Pratt nhận định.
Theo quan điểm của Pratt, điểm hiệu quả trong phiên bản của Snowflake là sự chia tách này. Horizon Context bao gồm những gì các nhóm tự tuyên bố và tuyển chọn, còn Cortex Sense bao gồm những gì nền tảng tự động thu thập. Quan trọng không kém, họ đã neo Horizon Context bên trong lớp danh mục và quản trị thay vì bắn thêm nó vào sau này.
"Lớp ngữ cảnh là chiến trường thực sự cho AI tác nhân (Agentic AI). Một tác nhân chỉ đáng tin cậy bằng dữ liệu và ngữ nghĩa đằng sau nó," Pratt nói.
Mike Leone, Phó chủ tịch và nhà phân tích chính tại Moor Insights & Strategy, cũng đồng ý rằng việc xử lý hai lớp này một cách khác nhau là một quyết định kiến trúc đúng đắn.
"Tôi thích hướng đi của Snowflake. Họ đang chia ngữ cảnh thành hai nhóm, với Horizon Context bao gồm những gì khách hàng định nghĩa rõ ràng và Cortex Sense bao gồm những gì nền tảng tự tìm ra," Leone nói với VentureBeat. "Bạn không thể tin tưởng hai thứ đó theo cùng một cách, vì vậy xử lý chúng khác nhau là một lời kêu gọi đúng đắn. Nếu Snowflake có thể chứng minh hai lớp này hòa giải sạch sẽ và bạn có thể thấy mọi câu trả lời đến từ đâu, họ có một thứ gì đó thực sự."
Điều này có ý nghĩa gì đối với các doanh nghiệp
Đối với các doanh nghiệp đang đánh giá các lớp ngữ cảnh, hướng đi kiến trúc là rõ ràng. Nhưng khoảng cách thực thi thì chưa chắc chắn.
Các tác nhân nâng cao tiêu chuẩn cho một vấn đề cũ. Ý tưởng về lớp ngữ nghĩa đã tồn tại từ nhiều năm, nhưng các tác nhân thay đổi chi phí thất bại — khi một tác nhân đưa ra câu trả lời sai ở quy mô lớn, thiệt hại là ngay lập tức. Leone rất thẳng thắn về điều đó có nghĩa là gì đối với hầu hết các nhà cung cấp hiện có trên thị trường.
"Hầu hết các nhà cung cấp bán giải pháp 'thả vào là chạy' (drop-in fix) đều hứa hẹn quá mức," Leone nói. "Thả một cái vào một doanh nghiệp thực sự và nó chủ yếu phơi bày mức độ lộn xộn của dữ liệu và định nghĩa của bạn, và nhiều công ty sắp phát hiện ra điều đó theo cách khó khăn."
Tiêu chuẩn đánh giá là cụ thể. Pratt đã xác định những gì phân biệt các lớp ngữ cảnh hoạt động so với những cái bị đình trệ: quản trị và dòng dữ liệu (lineage) được tích hợp sẵn để các nhóm có thể kiểm toán lý do tại sao tác nhân đưa ra câu trả lời đó, tính di động để ngữ cảnh và chính sách không bị khóa với một nhà cung cấp, và độ chính xác có thể được đo lường và tái sử dụng trên các tác nhân và công cụ.
"Các doanh nghiệp không cần một silo ngữ nghĩa khác," Pratt nói. "Họ cần một lớp ngữ cảnh được quản trị, có thể di chuyển và đủ đáng tin cậy để kiểm toán."



