Anthropic ra mắt "Dreaming": Hệ thống giúp AI tự học và cải thiện từ sai lầm

Anthropic vừa công bố tính năng "Dreaming" cho nền tảng Claude Managed Agents, cho phép các tác nhân AI tự rút kinh nghiệm từ các phiên làm việc trước để nâng cao hiệu suất mà không cần sự can thiệp của con người. Cùng với đó, hai tính năng "Outcomes" và "Multi-agent orchestration" cũng được chuyển sang bản beta công khai, nhằm giải quyết các thách thức về độ chính xác và khả năng mở rộng khi triển khai AI trong doanh nghiệp.

Tại hội nghị nhà phát triển Code with Claude thường niên lần thứ hai diễn ra tại San Francisco, Anthropic đã công bố loạt cập nhật quan trọng cho nền tảng Claude Managed Agents. Điểm nhấn của sự kiện là tính năng mới mang tên "Dreaming" (Mơ mộng), cho phép các tác nhân AI học hỏi từ các phiên làm việc trong quá khứ để cải thiện hiệu quả theo thời gian. Đây được xem là bước tiến tới các hệ thống AI tự sửa lỗi và tự hoàn thiện mà các doanh nghiệp đang mong đợi trước khi tin tưởng giao phó công việc thực tế cho AI.

Bên cạnh tính năng Dreaming, Anthropic cũng đưa hai tính năng thử nghiệm trước đây là "Outcomes" (Kết quả) và "Multi-agent orchestration" (Điều phối đa tác nhân) từ giai đoạn nghiên cứu sang bản beta công khai. Sự kết hợp của ba tính năng này giải quyết những vấn đề khó khăn nhất khi vận hành các tác nhân AI ở quy mô lớn: duy trì độ chính xác, hỗ trợ khả năng học hỏi và ngăn chặn tình trạng tắc nghẽn trong các quy trình làm việc phứcạp.

Các đơn vị áp dụng sớm đã báo cáo những kết quả đáng kể. Công ty AI pháp lý Harvey thấy tỷ lệ hoàn thành nhiệm vụ tăng khoảng 6 lần sau khi triển khai Dreaming. Wisedocs, chuyên xem xét tài liệu y tế, giảm 50% thời gian xem xét nhờ tính năng Outcomes. Trong khi đó, Netflix đang sử dụng điều phối đa tác nhân để xử lý nhật ký từ hàng trăm bản dựng đồng thời.

Tính năng Dreaming giúp AI học hỏi từ lịch sử như thế nào?

Dreaming là tính năng mới lạ nhất trong bộ ba tính năng mới. Khác với hệ thống bộ nhớ thông thường mà Anthropic ra mắt trước đó (cho phép Claude lưu giữ sở thích và ngữ cảnh trong các phiên), Dreaming hoạt động ở mức độ trừu tượng cao hơn. Đây là một quy trình được lên lịch, xem xét lại các phiên làm việc trong quá khứ và kho lưu trữ bộ nhớ của tác nhân, từ đó trích xuất các mô hình và tinh chỉnh bộ nhớ để tác nhân hoạt động tốt hơn theo thời gian.

Tính năng này cung cấp những thông tin chi tiết mà không một phiên tác nhân đơn lẻ nào có thể tự nhìn thấy: các lỗi lặp đi lặp lại, quy trình làm việc mà nhiều tác nhân độc lập cùng hướng tới, và các sở thích chung được chia sẻ trên nhóm tác nhân.

Alex Albert, người phụ trách quản lý sản phẩm nghiên cứu tại Anthropic, giải thích rằng Dreaming tương tự như cách con người tạo ra kỹ năng sau khi hoàn thành một nhiệm vụ. Ông ví von: "Thay vì bạn tự tạo ra kỹ năng từ kinh nghiệm làm việc với Claude, mô hình sẽ làm điều đó, vì vậy nó có cùng ngữ cảnh đó cho các phiên trong tương lai".

Điều quan trọng là Dreaming không sửa đổi các trọng số (weights) của mô hình cơ bản. "Chúng tôi không thay đổi chính mô hình thông qua Dreaming — nó không thực hiện cập nhật trọng số hay bất cứ thứ gì tương tự", Albert nói. Thay vào đó, tác nhân ghi lại các bài học dưới dạng ghi chú văn bản thuần túy và các "sách hướng dẫn" (playbooks) có cấu trúc mà các phiên tương lai có thể tham khảo. Điều này giúp toàn bộ quá trình có thể quan sát và kiểm toán bởi con người.

Bản demo trực tiếp cho thấy AI cải thiện qua đêm mà không cần hướng dẫn của con người

Trong bài phát biểu chính, đội ngũ Anthropic đã trình diễn trực tiếp cả ba tính năng trên sân khấu với kịch bản một startup hàng không giả định tên "Lumara" cần hạ cánh drone tự động lên mặt trăng để khai thác tài nguyên. Đội ngũ đã cấu hình một hệ thống đa tác nhân với ba chuyên gia: một tác nhân chỉ huy chịu trách nhiệm thành công chung, một tác nhân phát hiện xác định địa điểm hạ cánh tốt và một tác nhân điều hướng xử lý việc bay và hạ cánh an toàn.

Mô phỏng ban đầu tại sáu địa điểm hạ cánh giả định cho kết quả khá tốt nhưng chưa hoàn hảo. Để cải thiện, người trình bày đã kích hoạt một phiên Dreaming trực tiếp từ bảng điều khiển của nhà phát triển. Qua đêm, tác nhân Dreaming đã xem xét tất cả các phiên mô phỏng trong quá khứ và viết ra một sách hướng dẫn hạ cánh chi tiết dựa trên các mô hình từ nhiều lần chạy nhiệm vụ. Khi đội ngũ chạy mô phỏng mới vào sáng hôm sau với sách hướng dẫn này, kết quả đã được cải thiện đáng kể tại các địa điểm trước đó hoạt động kém.

"All we had to do was just have Caitlin press a button," — Angela Jiang, Trưởng bộ phận Sản phẩm của nền tảng Claude, nói khi nhắc đến đồng nghiệp trên sân khấu. "Tất cả là nhờ Dreaming."

Tại sao Anthropic xây dựng một tác nhân "giám khảo" riêng để kiểm tra công việc của Claude?

Tính năng Outcomes, hiện đã có trong bản beta công khai, cho phép các nhà phát triển định nghĩa sự thành công trông như thế nào bằng cách sử dụng một bảng tiêu chí (rubric). Điều tạo nên sự khác biệt về mặt kiến trúc của tính năng này là sự tách biệt mối quan tâm. Khi một tác nhân hoàn thành công việc, một tác nhân "giám khảo" (grader) riêng biệt sẽ đánh giá đầu ra dựa trên bảng tiêu chí do nhà phát triển định nghĩa trong cửa sổ ngữ cảnh độc lập của nó. Vì giám khảo hoạt động trong ngữ cảnh mới, nó không bị ảnh hưởng bởi lý luận của tác nhân đang làm việc hay các thiên kiến tích lũy trong phiên đó.

Khi giám khảo phát hiện ra sự chênh lệch giữa đầu ra và tiêu chí, nó sẽ chỉ định cụ thể những gì cần thay đổi, và tác nhân làm việc sẽ thực hiện thêm một lượt nữa. Vòng lặp này tiếp tục cho đến khi các tiêu chí được đáp ứng mà không cần con người xem xét mỗi lần thử.

Albert mô tả chiến lược xác minh rộng rãi hơn của Anthropic là sử dụng "nhiều tính toán thời gian kiểm tra hơn, nhiều mô hình suy nghĩ về một vấn đề lâu hơn để kiểm tra công việc của mô hình khác". Ông thừa nhận việc để mô hình tự kiểm tra công việc của mình đặt ra những câu hỏi hợp lý, nhưng cho thấy một cửa sổ ngữ cảnh mới xem xét công việc đã hoàn thành luôn hoạt động hiệu quả hơn việc yêu cầu cùng một luồng chạy dài tự nhận ra lỗi của chính nó.

Các tác nhân AI song song giờ đây có thể giải quyết các nhiệm vụ quá phức tạp cho một luồng mô hình đơn lẻ

Multi-agent orchestration, tính năng thứ ba chuyển sang bản beta công khai, cho phép một tác nhân chính phân tách một nhiệm vụ lớn thành các nhiệm vụ phụ và ủy quyền từng nhiệm vụ cho một tác nhân chuyên môn — mỗi tác nhân có mô hình, hệ thống nhắc nhở (system prompt), công cụ và cửa sổ ngữ cảnh độc lập. Mọi bước trong quy trình đều có thể truy xuất trong bảng điều khiển Claude, cho thấy tác nhân nào làm gì, theo thứ tự nào và tại sao.

Thiết kế này mang lại cho mỗi tác nhân phụ một ngữ cảnh cô lập, mà Anthropic cho biết tạo ra kết quả tốt hơn so với việc để một tác nhân đơn lẻ cố gắng nắm giữ toàn bộ sự phức tạp trong một luồng. "Mỗi tác nhân phụ có luồng và cửa sổ ngữ cảnh độc lập của riêng mình," người thuyết trình giải thích. "Điều này rất có chủ đích — chúng tôi nhận thấy rằng bằng cách chia nhỏ công việc và sau đó hợp nhất kết quả, chúng tôi đạt được kết quả tốt hơn."

Albert đưa ra heuristic của riêng mình về thời điểm kiến trúc đa tác nhân có ý nghĩa so với việc bám vào một luồng đơn. "Các tác nhân song song tốt hơn cho điều tra," ông nói — những tình huống có nhiều ngữ cảnh sẽ cuối cùng bị loại bỏ. "Nếu bạn đang cố gắng trả lời một câu hỏi cụ thể, bạn không cần tất cả kết quả tìm kiếm từ các khu vực mà nó không tìm thấy câu trả lời. Bạn chỉ cần câu trả lời."

Cá cược lớn hơn của Anthropic: Thu hẹp khoảng cách giữa khả năng AI và việc áp dụng thực tế

Ba tính năng này xuất hiện như một phần của nỗ lực nền tảng rộng lớn hơn mà Anthropic định hình trong suốt hội nghị là việc thu hẹp "khoảng cách giữa những gì AI có thể làm và những gì nó thực sự làm cho con người". Ami Vora, Giám đốc Sản phẩm của Anthropic, đã thiết lập chủ đề này trong bài phát biểu khai mạc, lưu ý rằng trong khi khả năng của mô hình đang tăng trưởng theo đường cong cấp số nhân, hầu hết các tổ chức vẫn đang áp dụng AI theo đường tuyến tính.

Sự kiện cũng bao gồm một số thông báo về cơ sở hạ tầng được thiết kế để giúp các nhà phát triển bắt kịp tốc độ. Anthropic cho biết họ đang tăng gấp đôi giới hạn tốc độ 5 giờ cho các gói Pro, Max, Team và Enterprise, đồng thời nâng đáng kể giới hạn tốc độ API. Công ty cũng công bố hợp tác với SpaceX để sử dụng toàn bộ công suất của trung tâm dữ liệu Colossus nhằm mở rộng tính khả dụng của máy tính — một phản hồi trực tiếp trước tình trạng thiếu hụt nhu cầu mà CEO Amodei mô tả.

Tính năng Dreaming hiện đã có trong bản xem trước nghiên cứu. Outcomes và điều phối đa tác nhân đang ở bản beta công khai và có sẵn cho tất cả nhà phát triển trên nền tảng Claude. Với những công cụ mới này, tương lai của AI doanh nghiệp đang trở nên gần hơn và thực tế hơn bao giờ hết.