Google ra mắt Subagents trong Gemini CLI: Ủy quyền tác vụ và quy trình làm việc song song

20 tháng 4, 2026·3 phút đọc

Google đã giới thiệu tính năng Subagents cho Gemini CLI, cho phép các nhà phát triển ủy quyền các tác vụ phức tạp hoặc lặp lại cho các tác nhân AI chuyên biệt hoạt động song song với phiên chính. Tính năng này giúp giảm tải ngữ cảnh, tối ưu hóa hiệu suất và cho phép tùy chỉnh quy trình làm việc linh hoạt hơn.

Google ra mắt Subagents trong Gemini CLI: Ủy quyền tác vụ và quy trình làm việc song song

Google vừa giới thiệu tính năng Subagents (tác nhân con) trong Gemini CLI, một khả năng mới được thiết kế để giúp các nhà phát triển ủy quyền các tác vụ phức tạp hoặc lặp lại cho các tác nhân AI chuyên biệt hoạt động song song với phiên làm việc chính.

Tính năng này cho phép tác nhân chính đóng vai trò là người điều phối, giao các nhiệm vụ phụ như phân tích mã, nghiên cứu hoặc kiểm thử cho các tác nhân con chuyên biệt. Mỗi tác nhân con hoạt động trong một môi trường cô lập và trả về kết quả tóm tắt cho phiên chính, giúp giảm thiểu việc quá tải ngữ cảnh và nâng cao hiệu suất trong các tương tác kéo dài.

Theo Google, cách tiếp cận này nhằm giải quyết các hạn chế phổ biến trong quy trình làm việc của tác nhân, đặc biệt là sự tích lũy các bước trung gian có thể làm chậm phản hồi và tăng chi phí. Bằng cách chuyển các thao tác chi tiết sang tác nhân con, tác nhân chính có thể tập trung vào lập luận cấp cao hơn và tạo ra kết quả đầu ra cuối cùng tốt hơn.

Thực thi song song và tùy biến linh hoạt

Các tác nhân con cũng có thể chạy song song, cho phép thực hiện nhiều tác vụ cùng lúc. Ví dụ, nhà phát triển có thể chỉ đạo hệ thống phân tích các phần khác nhau của cơ sở mã hoặc thực hiện nhiều nhiệm vụ nghiên cứu cùng một lúc. Mặc dù điều này có thể giảm tổng thời gian thực thi, Google lưu ý rằng việc thực thi song song có thể đi kèm với rủi ro như xung đột thay đổi mã và tăng giới hạn sử dụng do các yêu cầu đồng thời.

Một khía cạnh quan trọng của tính năng này là khả năng tùy biến. Nhà phát triển có thể tạo các tác nhân con của riêng mình bằng cách sử dụng tệp Markdown với cấu hình YAML, cho phép định nghĩa vai trò, công cụ và hướng dẫn hành vi. Các tác nhân này có thể được lưu trữ cục bộ hoặc trong kho lưu trữ, cho phép các nhóm chuẩn hóa quy trình làm việc hoặc thực thi các quy tắc mã hóa trên các dự án. Ngoài ra, Google cung cấp một số tác nhân tích hợp sẵn, chẳng hạn như trợ lý đa năng, trợ lý dòng lệnh (CLI) và tác nhân điều tra cơ sở mã.

Hệ thống cho phép ủy quyền rõ ràng thông qua cú pháp lệnh (prompt), giúp người dùng giao nhiệm vụ cho các tác nhân cụ thể trực tiếp. Điều này mang lại cho nhà phát triển quyền kiểm soát lớn hơn đối với việc phân phối nhiệm vụ thay vì chỉ phụ thuộc vào định tuyến tự động.

Xu hướng kiến trúc đa tác nhân

Bản phát hành này làm nổi bật xu hướng hướng tới các kiến trúc đa tác nhân, nơi các thành phần riêng biệt quản lý các nhiệm vụ cụ thể thay vì dựa vào một mô hình duy nhất, giúp cải thiện khả năng mở rộng và tính bảo trì trong các quy trình phát triển phức tạp.

Tuy nhiên, phản hồi từ người dùng sớm cho thấy trải nghiệm của nhà phát triển vẫn còn chỗ để cải thiện. Một bình luận nhấn mạnh những lo ngại đang diễn ra:

"Google nên đầu tư nhiều hơn vào sự ổn định và UI/UX cho gemini-cli. Hiện tại, trải nghiệm, ngay cả với gói Pro, khá kém. Các mô hình khá tốt, nhưng bạn nên làm việc nhiều hơn nữa trên bộ công cụ."

Mặc dù việc giới thiệu Subagents mở rộng khả năng của Gemini CLI, việc áp dụng rộng rãi có thể phụ thuộc vào tốc độ giải quyết các vấn đề về tính dễ sử dụng và độ tin cậy song song với việc phát triển tính năng.

Bài viết được tổng hợp và biên soạn bằng AI từ các nguồn tin tức công nghệ. Nội dung mang tính tham khảo. Xem bài gốc ↗