AWS Ra Mắt Thế Hệ Tiếp Theo Của Amazon OpenSearch Serverless

Amazon Web Services (AWS) chính thức ra mắt thế hệ tiếp theo của Amazon OpenSearch Serverless với kiến trúc được thiết kế lại, mang lại tốc độ cấp phát tài nguyên nhanh hơn 20 lần và khả năng thu nhỏ về không (scale-to-zero) thực sự. Dịch vụ này được định vị là nền tảng xây dựng các ứng dụng AI tác tử (agentic AI), giúp giảm tới 60% chi phí so với các cụm máy chủ được cấp phát trước đó.

Amazon Web Services (AWS) vừa công bố tính khả dụng chung (General Availability) cho thế hệ tiếp theo của Amazon OpenSearch Serverless. Phiên bản mới sở hữu kiến trúc được thiết kế lại, cho phép cấp phát tài nguyên nhanh hơn 20 lần so với kiến trúc serverless trước đây, hỗ trợ khả năng thu nhỏ về không (scale-to-zero) thực sự và giảm chi phí lên tới 60% đối với khối lượng công việc cao điểm so với các cụm máy chủ (cluster) được cấp phát truyền thống.

AWS định vị dịch vụ này là một khối xây dựng nền tảng quan trọng cho việc phát triển các ứng dụng AI tác tử (agentic AI), đi kèm với các tích hợp chuyên biệt với các môi trường phát triển tích hợp AI như Cursor và Kiro, cũng như các kỹ năng mới để kết nối và quản lý tài nguyên OpenSearch Serverless.

Cải tiến kiến trúc NextGen

Theo các kỹ sư kiến trúc giải pháp của AWS, thế hệ mới này giới thiệu hai kiến trúc được đặt tên là Classic (dành cho các bộ sưu tập hiện có) và NextGen (mặc định cho các bộ sưu tập mới và nơi chứa các cải tiến).

Kiến trúc Amazon OpenSearch Serverless

Điểm nổi bật trong kiến trúc NextGen là lớp lưu trữ dùng chung mới giúp tách biệt tài nguyên tính toán (được gọi là OpenSearch Capacity Units - OCU) khỏi lưu trữ. Điều này khiến các OCU trở nên không trạng thái (stateless), mang lại hai hệ quả thực tế lớn:

Cấp phát nhanh: Các OCU không cần khởi tạo đĩa cục bộ (bootstrap local disk); chúng có thể bắt đầu phục vụ các yêu cầu trong vài giây vì lưu trữ dùng chung được gắn trực tiếp vào OCU.
Thu nhỏ hiệu quả: Dung lượng nhàn rỗi có thể được giải phóng mà không ảnh hưởng đến dữ liệu người dùng vì dữ liệu không nằm trên OCU.

Tối ưu hóa cho AI tác tử

AWS đang định vị OpenSearch Serverless là nền tảng cơ bản cho các khối lượng công việc AI tác tử, cung cấp tích hợp gốc với các nền tảng phát triển AI như Vercel và Kiro. AWS cũng đã đóng góp vào "OpenSearch Agent Skills" với các kỹ năng chuyên biệt cho phép các nhà phát triển cấp phát và quản lý tài nguyên OpenSearch ngay từ các nền tảng lập trình hỗ trợ AI phổ biến như Claude Code, Cursor và Codex.

Đối với các nhà phát triển xây dựng ứng dụng AI tác tử trên Vercel, họ giờ đây có thể sử dụng OpenSearch Serverless để tạo các bộ sưu tập serverless mới hoặc kết nối với các bộ sưu tập hiện có trực tiếp từ bảng điều khiển của Vercel.

Quản lý mạng và Collection Groups

Kiến trúc mới cũng giới thiệu hai định dạng endpoint mới dưới tên miền on.aws, cả hai đều sử dụng AWS PrivateLink. Điều này cho phép tạo các điểm cuối mạng riêng ảo (VPC) để truy cập nội bộ từ VPC của người dùng hoặc cơ sở hạ tầng tại chỗ.

Endpoint theo bộ sưu tập: Hoạt động giống như trước đây, cung cấp quyền truy cập vào một bộ sưu tập cho mỗi endpoint.
Endpoint theo khu vực cho tài khoản: Cấp cho người dùng quyền truy cập vào tất cả các bộ sưu tập thông qua một tên máy chủ duy nhất. Người dùng có thể chỉ định bộ sưu tập mục tiêu bằng cách sử dụng các tiêu đề x-amz-aoss-collection-id hoặc x-amz-aoss-collection-name. Endpoint mới này cho phép quản lý tài nguyên mạng tốt hơn, chẳng hạn như nhóm kết nối duy nhất và phiên TLS.

Ngoài ra, Collection Groups (Nhóm bộ sưu tập), được giới thiệu vào tháng 2 năm 2026, hiện đóng vai trò trung tâm hơn khi tạo và quản lý các bộ sưu tập NextGen. Thế hệ (Classic hoặc NextGen) chỉ được đặt ở cấp nhóm và áp dụng cho tất cả các bộ sưu tập được tạo trong nhóm đó. Người dùng có thể sử dụng nhóm bộ sưu tập để chia sẻ dung lượng tính toán trên nhiều bộ sưu tập, giúp giảm chi phí cho các khối lượng công việc nhỏ hơn.

Phản hồi từ cộng đồng

Trên các mạng xã hội, người dùng hoan nghênh việc giới thiệu tính năng scale-to-zero, nhấn mạnh rằng đây là một trong những điểm đau chính khi sử dụng dịch vụ này cho các trường hợp sử dụng nhỏ.

"Đây là một bước tiến lớn. Cho đến nay, chúng ta phải sử dụng các giải pháp như Algolia để có cơ sở dữ liệu tìm kiếm serverless thực sự. Giờ đây chúng ta có thể bắt đầu sử dụng OpenSearch cho các ứng dụng nhỏ."

Tuy nhiên, một số người dùng khác cảnh báo rằng scale-to-zero đi kèm với các sự đánh đổi, chẳng hạn như thời gian khởi động nguội (cold start), và các nhóm cần đánh giá xem chúng ảnh hưởng như thế nào đến ứng dụng của mình.

"[...] Chi phí nhàn rỗi thấp hơn và đa thuê (multi-tenancy) tốt hơn, nhưng các nhóm vẫn nên lập kế hoạch cho các lần khởi động nguội và độ trễ khởi tạo."

Thế hệ tiếp theo của Amazon OpenSearch Service hiện có sẵn tại tất cả các khu vực thương mại của AWS nơi Amazon OpenSearch Serverless đã có mặt. Người dùng bị tính phí cho tài nguyên tính toán được sử dụng trong OCU cho tìm kiếm, lập chỉ mục và tăng tốc GPU. Lưu trữ được tính phí riêng theo GB-tháng.