Internet đang được xây dựng lại để phục vụ máy móc thay vì con người
Khi các tác nhân AI chuyển từ giai đoạn thử nghiệm sang vận hành thực tế, các ông lớn công nghệ như AWS và Cloudflare đang tái thiết kế hạ tầng đám mây để thích ứng với tương lai nơi lưu lượng truy cập do máy móc chiếm ưu thế.

Hạ tầng đám mây từ lâu đã được thiết kế xoay quanh hành vi của con người: tìm kiếm, nhấp chuột, cuộn trang và xem video một cách ổn định và dễ dự đoán. Tuy nhiên, các tác nhân AI (AI agents) lại hoạt động khác biệt hoàn toàn. Chúng có thể tạo ra một làn sóng hoạt động khổng lồ, kích hoạt hàng trăm truy vấn cơ sở dữ liệu, tìm kiếm tài liệu và gọi API chỉ trong vài giây rồi biến mất nhanh chóng như khi chúng xuất hiện.
Dựa trên thực tế đó, Amazon đang tái thiết kế một phần cốt lõi trong hạ tầng đám mây của mình. Vào thứ Năm tuần vừa qua, AWS đã ra mắt thế hệ tiếp theo của OpenSearch Serverless — một hệ thống tìm kiếm và cơ sở dữ liệu vector được quản lý hoàn toàn — được thiết kế riêng cho các khối lượng công việc của tác nhân AI. AWS khẳng định hệ thống mới này có thể mở rộng quy mô tức thì khi các tác nhân kích hoạt nhiệm vụ và thu hẹp về 0 khi không hoạt động.
Sự ra mắt này phản ánh nhận thức ngày càng tăng trong ngành công nghệ: hạ tầng được thiết kế cho internet do con người điều khiển không còn hiệu quả trong một thế giới ngày càng có nhiều tác nhân AI.
Mặc dù các tác nhân AI hiện chỉ chiếm một phần nhỏ trong hoạt động internet, lưu lượng truy cập do máy móc tạo ra đã rất đáng kể và sẵn sàng bùng nổ. Cloudflare cho biết các bot đã chiếm 31% tổng lưu lượng HTTP trong 6 tháng qua. Các trình thu thập dữ liệu AI, công cụ tìm kiếm và trợ lý ảo chiếm khoảng một phần tư tổng số yêu cầu từ bot trong giai đoạn này.
Li Yi Ohlsen, quản lý sản phẩm cấp cao của Cloudflare, nhận định với TechCrunch: "Lưu lượng truy cập không phải con người sẽ vượt qua lưu lượng của con người vào sometime trong nửa đầu năm 2027."
Tại hội nghị Google I/O tuần trước, gã khổng lồ tìm kiếm cho biết người dùng có thể ủy quyền các nhiệm vụ cho hệ thống AI như nghiên cứu mua sắm, đặt du lịch, duyệt web và tương tác với ứng dụng. Tuy nhiên, xu hướng này không chỉ dừng lại ở các tác nhân AI hướng tới người dùng cuối. Các doanh nghiệp đang ngày càng triển khai các tác nhân nội bộ và cho khách hàng, tạo ra những loại lưu lượng máy móc mới phía sau hậu trường.
Hệ quả là, các nhà cung cấp đám mây và công ty hạ tầng đang phải tìm cách thích nghi hệ thống được xây dựng cho con người với một thế giới của các tác nhân liên tục và tự chủ truy xuất thông tin, gọi công cụ và tạo ra lưu lượng máy-đến-máy.
Đó chính là lúc OpenSearch Serverless mới của AWS phát huy tác dụng.
Tia White, giám đốc quản lý Amazon OpenSearch Service, chia sẻ với TechCrunch: "Thời điểm này rất rõ ràng. Các tác nhân đang chuyển từ thử nghiệm sang sản xuất thực tế, và chúng tạo ra các mô hình lưu lượng mà hạ tầng trước đây chưa được thiết kế để xử lý. Chúng tăng đột biến mà không báo trước và ngừng hoạt động mà không báo trước, và doanh nghiệp cần công cụ tìm kiếm có thể theo kịp mà không phải trả tiền cho tính toán nhàn rỗi."
Thay đổi kỹ thuật quan trọng của thế hệ mới này là tách biệt tính toán (compute) khỏi lưu trữ (storage). Điều này cho phép tính toán mở rộng trong vài giây để xử lý sự bùng nổ của tác nhân và thu hẹp về 0, giúp khách hàng trả 0 đồng khi tác nhân không hoạt động.
"Trước đây, ngay cả trong phiên bản Serverless trước đó, bạn phải có ít nhất một phiên bản đang hoạt động và chạy vì lưu trữ và tính toán được kết hợp với nhau," White nói. "Bạn không thể tự động kích hoạt tính toán với tốc độ bạn cần, vì vậy bạn luôn phải dành dụm tính toán nhàn rỗi cho khối lượng công việc của mình, dù bạn có sử dụng nó hay không."
Hãy tưởng tượng nó giống như việc luôn phải trả tiền cho một chỗ đỗ xe, ngay cả khi bạn không sử dụng. Với phiên bản Serverless nâng cấp của AWS, nó giống như việc trả tiền cho một chỗ đỗ xe tính theo giờ hơn.
Khi ra mắt, OpenSearch Serverless sẽ tích hợp sẵn với các nền tảng phát triển AI như Vercel và Kiro, giúp các nhà phát triển có thể triển khai các backend tìm kiếm và vector sẵn sàng cho sản xuất cho các tác nhân mà không cần quản lý hạ tầng.
Sự chuyển dịch này đang diễn ra trên toàn ngành đám mây. Databricks và Snowflake đang định vị lại mình thành hệ thống bộ nhớ và truy xuất AI cho dữ liệu doanh nghiệp. Microsoft đã tung ra các bản cập nhật cho Azure được thiết kế để xử lý sự bùng nổ của tác nhân AI và chia sẻ bộ nhớ giữa các tác nhân. Tương tự như Amazon, Cloudflare tháng trước đã giới thiệu hạ tầng nhằm cung cấp môi trường liên tục và khả năng mở rộng tức thì cho các tác nhân.
Càng nhiều công ty triển khai AI agents, áp lực tái thiết kế hạ tầng xung quanh khối lượng công việc do máy tạo ra càng lớn, điều này ngược lại có thể làm cho việc triển khai các tác nhân này trở nên rẻ hơn và dễ dàng hơn ở quy mô lớn.



