Anthropic Giải Thích Cách Claude Tự Xây Dựng Cơ Chế Thực Thi

Anthropic đã công bố thêm chi tiết về hệ thống điều phối đằng sau tính năng Dynamic Workflows của Claude Code, cho phép tạo ra các cơ chế thực thi tùy chỉnh để điều phối đội ngũ các tác nhân AI giải quyết các nhiệm vụ phức tạp.

Anthropic vừa chia sẻ thêm thông tin chi tiết về hệ thống điều phối (orchestration system) đứng sau tính năng Dynamic Workflows mới được giới thiệu trong Claude Code. Thay vì chỉ dựa vào một ngữ cảnh duy nhất, Claude giờ đây có khả năng tự động tạo ra các "execution harnesses" (cơ chế thực thi) bằng JavaScript để quản lý và điều phối một đội ngũ các tác nhân AI (AI agents) làm việc cùng nhau.

Theo Anthropic, Claude có thể tự động tạo ra các harness bằng JavaScript để ủy quyền nhiệm vụ, phân công tác nhân, xác thực kết quả và xác định thời gian thực hiện quy trình làm việc.

Giải quyết các thách thức của AI dài hạn

Công ty cho rằng phương pháp này giúp giải quyết một số thách thức liên quan đến các nhiệm vụ AI kéo dài. Anthropic xác định các vấn đề như "agentic laziness" (sự lười biếng của tác nhân), nơi hệ thống AI dừng lại trước khi hoàn thành đầy đủ nhiệm vụ; "self-preferential bias" (thiên kiến tự ưu), khi mô hình ưu tiên kết luận của chính mình trong quá trình đánh giá; và "goal drift" (sự trôi dạt mục tiêu), khi các mục tiêu bị pha loãng trong các tương tác kéo dài.

Các chiến lược điều phối thông minh

Dynamic Workflows sử dụng nhiều tác nhân độc lập, mỗi tác nhân có vai trò cụ thể, thay vì chỉ sử dụng một cửa sổ ngữ cảnh (context window) đơn lẻ. Anthropic phác thảo các chiến lược cho Claude bao gồm:

Fan-out-and-synthesize: Chia nhỏ nhiệm vụ thành các tác vụ con song song và sau đó tổng hợp lại.
Adversarial verification: Các tác nhân đóng vai trò người thẩm định sẽ thách thức phát hiện của các tác nhân khác để đảm bảo tính chính xác.

Công ty cũng nhấn mạnh các quy trình theo kiểu đấu loại (tournament-style), trong đó nhiều tác nhân cố gắng giải quyết cùng một vấn đề bằng các cách tiếp cận khác nhau và được đánh giá lẫn nhau, cũng như các hệ thống phân loại định tuyến nhiệm vụ đến các tác nhân khác nhau dựa trên độ phức tạp hoặc yêu cầu.

Tối ưu hóa chi phí với Model Routing

Một khía cạnh đáng chú ý của hệ thống là khả năng định tuyến mô hình (model routing). Anthropic cho biết các quy trình làm việc có thể chỉ định các mô hình khác nhau cho các giai đoạn khác nhau của một nhiệm vụ. Điều này cho phép sử dụng các mô hình chi phí thấp hơn để xử lý công việc đơn giản, trong khi dành các mô hình có khả năng cao hơn cho các nhiệm vụ đòi hỏi suy luận sâu.

Phản ứng từ cộng đồng công nghệ

Tính năng này đã tạo ra những phản ứng trái chiều trong giới lập trình viên. Một số người dùng coi Dynamic Workflows là một bước tiến quan trọng hướng tới các hệ thống AI tự chủ hơn, trong khi những người khác nghi ngờ về sự cân bằng giữa chi phí và lợi ích. Trong một cuộc thảo luận trên Reddit, một người dùng nhận định:

"Nó sẽ rất tuyệt vời một ngày nào đó, nhưng lúc này nó chỉ là một cách rất ngầu để đốt token."

Những người khác lại chỉ ra sự linh hoạt mà việc lựa chọn mô hình mang lại:

"Quy trình làm việc động trong Claude Code cho phép kiểm soát chính xác các tác nhân con cụ thể được sử dụng ở từng giai đoạn. Tùy thuộc vào mức độ phức tạp, bạn có thể sử dụng các mô hình khác nhau cho các nhiệm vụ khác nhau."

Cuộc thảo luận phản ánh xu hướng rộng lớn hơn trong phát triển AI, nơi các công ty ngày càng tập trung vào các khung điều phối, hệ thống xác minh và sự điều phối đa tác nhân như một cách để cải thiện hiệu suất vượt qua khả năng của các mô hình đơn lẻ.