AWS để AI điều khiển máy tính ảo: Một cú click chuột có thể ngốn 500.000 token
Amazon Web Services (AWS) vừa cho phép các tác nhân AI truy cập và điều khiển máy tính ảo WorkSpaces. Mặc dù mang lại khả năng tự động hóa mới, một nghiên cứu cho thấy phương pháp này có thể đắt hơn gấp nhiều lần so với việc sử dụng API truyền thống.

AWS để AI điều khiển máy tính ảo: Một cú click chuột có thể ngốn 500.000 token
Amazon Web Services (AWS) đã mở cửa cho phép các tác nhân AI (AI agents) "lái" các máy tính ảo trên nền tảng WorkSpaces của mình. Dịch vụ mới, hiện đang trong giai đoạn thử nghiệm, cho phép người dùng gán danh tính cho các tác nhân thông qua dịch vụ Quản lý Danh tính và Quyền truy cập (IAM) của Amazon.
Sử dụng thông tin xác thực này, các tác nhân có thể truy cập vào một WorkSpace thông qua một URL đã ký trước (pre-signed URL) và điều khiển bất kỳ ứng dụng nào đang chạy trên máy tính ảo đó.
Cơ chế hoạt động và kiểm soát
Một đại diện của AWS cho biết gã khổng lồ đám mây này khuyến nghị các nhà phát triển nên cấp cho mỗi tác nhân một danh tính riêng biệt. Điều này giúp việc theo dõi hoạt động trở nên dễ dàng hơn, cũng như phân biệt rõ ràng giữa hành động của tác nhân và hoạt động của con người.
Các tác nhân sẽ kết nối thông qua một điểm cuối MCP được quản lý, cung cấp quyền truy cập được kiểm soát vào các công cụ trên máy tính để bàn như chụp màn hình, điều khiển chuột và nhập văn bản. Theo AWS, điều này mang lại cho các nhà phát triển một giao diện được kiểm soát để tác nhân tương tác với máy tính để bàn, đồng thời duy trì các "hàng rào" an toàn xung quanh các hành động mà chúng có thể thực hiện.
Tại sao nên sử dụng máy tính ảo cho AI?
Lý do chính để cấp cho một tác nhân một chiếc PC riêng là để nó có thể tự động sử dụng phần mềm để thực hiện các nhiệm vụ khác nhau. Máy tính ảo hoặc PC đám mây rất phù hợp với kịch bản này vì chúng có tính tạm thời — bạn có thể chạy chúng đủ lâu để tác nhân hoàn thành công việc, sau đó tắt chúng đi.
Việc giữ các tác nhân trong một đám mây riêng ảo (VPC) cô lập cũng có thể ưu tiên hơn là để chúng tự do hoạt động trên mạng LAN hoặc trong trung tâm dữ liệu nội bộ. Các tổ chức phụ thuộc hoàn toàn vào PC vật lý, hoặc không muốn để tác nhân điều khiển máy ảo trên máy cục bộ, cũng có thể thích PC đám mây hơn là sự phức tạp khi thiết lập PC ảo tại chỗ (on-prem).
Cấu hình và đối thủ cạnh tranh
AWS sẽ cho phép truy cập tác nhân vào bất kỳ loại phiên bản nào mà dịch vụ WorkSpaces cung cấp — từ các phiên bản nhỏ chỉ có một vCPU và 2GB RAM cho đến các phiên bản mạnh mẽ tích hợp GPU, 32 vCPU và 256GB RAM. Amazon cho thuê tất cả WorkSpaces của mình với mức phí cố định hàng tháng cho phép truy cập không ngừng nghỉ, hoặc mức phí thấp hơn cộng với phí truy cập theo giờ.
Amazon không đơn độc trong việc cho phép tác nhân điều khiển PC đám mây: Microsoft cũng đã tạo ra một phiên bản dịch vụ Windows 365 dành riêng cho các tác nhân.
Cảnh báo về chi phí
Các tác nhân điều khiển PC bằng thị giác máy tính — chúng thường chụp ảnh màn hình hoặc video của màn hình desktop, diễn giải những gì chúng "thấy" và sau đó thực hiện hành động, giả sử chúng đã được cấp quyền để click, gõ phím và cuộn trang.
Công ty lập trình AI Reflex cho rằng công việc cần thiết để làm điều đó là không hề nhỏ. Công ty gần đây đã công bố nghiên cứu tuyên bố rằng một tác nhân thị giác sử dụng trình duyệt cần tới nửa triệu token (500.000 tokens) chỉ để click vào một menu thả xuống và kết luận rằng việc sử dụng tác nhân có thể đắt hơn 45 lần so với việc sử dụng API.
Palash Awasthi, người phụ trách phát triển của Reflex, thừa nhận rằng các mô hình AI tốt hơn cuối cùng sẽ giảm chi phí. Tuy nhiên, ông khẳng định rằng việc sử dụng tác nhân sẽ luôn yêu cầu nhiều bước hơn để hoàn thành một công việc so với API.
Vì vậy, có lẽ bạn nên cân nhắc kỹ trước khi vội vã thuê một máy tính ảo đám mây cho AI của mình?
Bài viết liên quan

Công nghệ
Tổng hợp thị trường M&A an ninh mạng: 33 thương vụ được công bố trong tháng 4/2026
04 tháng 5, 2026

Công nghệ
Bị AI từ chối hồ sơ xin việc? Cuộc chiến đơn độc của một sinh viên y khoa
05 tháng 5, 2026

Phần mềm
Bun công bố hướng dẫn chuyển đổi sang Rust, nhưng gọi dự án viết lại là "chưa chín muồi"
05 tháng 5, 2026
