Sử dụng OpenClaw để tăng cường hiệu suất: Một người có thể đạt được gì với các tác nhân AI tự chủ?

Bài viết chia sẻ kinh nghiệm thực tế xây dựng hệ thống đa tác nhân AI trên homelab để tự động hóa việc viết kỹ thuật, quản lý hạ tầng và nghiên cứu. Bằng sự kết hợp giữa các điều phối viên mạnh mẽ và các nhân cách chuyên biệt, một cá nhân có thể vận hành quy trình công việc phức tạp như một cả một đội nhóm.

Tôi chỉ là một người duy nhất. Tôi phải sản xuất nội dung cho nhiều lĩnh vực khác nhau và phải đối mặt với vô số việc cần sự chú ý: một hệ thống homelab, giám sát hạ tầng, các thiết bị nhà thông minh, quy trình viết bài kỹ thuật, một dự án xuất sách, tự động hóa gia đình và một loạt việc khác thường đòi hỏi cả một đội ngũ để giải quyết.

Kết quả là có thật: các bài đăng blog đã xuất bản, các báo cáo nghiên cứu được chuẩn bị sẵn trước khi tôi cần, các bất thường trong hạ tầng được phát hiện trước khi chúng gây ra sự cố, và các bản thảo tiến qua quy trình duyệt ngay cả khi tôi đang ngủ.

Bí mật của tôi — nếu có thể gọi là bí mật — chính là các tác nhân AI tự chủ chạy trên một máy chủ homelab. Mỗi tác nhân phụ trách một lĩnh vực. Mỗi cái có danh tính, bộ nhớ và không gian làm việc riêng. Chúng chạy theo lịch trình, nhận công việc từ hộp thư, trao đổi kết quả cho nhau và chủ yếu tự quản lý chính mình. Runtime điều phối tất cả những thứ này là OpenClaw.

Đây không phải là một bài hướng dẫn, và chắc chắn không phải là bài giới thiệu sản phẩm. Đây là nhật ký của một người xây dựng hệ thống. Hệ thống đã chạy đủ lâu để gặp phải những lỗi thú vị, và tôi đã học được đủ từ những lỗi đó để xây dựng các cơ chế xử lý xung quanh chúng. Dưới đây là sơ lược những gì tôi đã xây dựng, tại sao nó hoạt động, và yếu tố kết nối giữ tất cả lại với nhau.

9 Điều phối viên, 35 Nhân cách và rất nhiều Markdown (và đang tăng lên)

Tổng quan các tác nhân trong môi trường

Khi mới bắt đầu, chỉ có tôi và tác nhân OpenClaw chính. Tôi sớm nhận thấy cần nhiều tác nhân hơn: một tác nhân viết bài kỹ thuật, một người đánh giá kỹ thuật, và một số chuyên gia kỹ thuật có thể đóng góp ý kiến trong các lĩnh vực cụ thể. Chẳng mấy chốc, tôi có gần 30 tác nhân, tất cả đều có 5 tệp markdown bắt buộc, không gian làm việc và bộ nhớ riêng. Không gì hoạt động tốt cả.

Cuối cùng, tôi đã giảm con số xuống còn 8 tác nhân điều phối viên (orchestrator) tổng thể và một thư viện các "nhân cách" (personas) lành mạnh mà chúng có thể đóng vai hoặc sử dụng để tạo ra các tác nhân con.

Một trong những điều tôi thích nhất khi xây dựng tác nhân là đặt tên cho chúng. Hãy xem tôi có gì hôm nay:

CABAL (từ Command and Conquer — AI ác trong một trong các trò chơi): Đây là điều phối viên trung tâm và giao diện chính với cụm OpenClaw của tôi.
DAEDALUS (AI từ Deus Ex): Phụ trách viết bài kỹ thuật: blog, bài đăng LinkedIn, giấy tờ nghiên cứu ý kiến, tài liệu quyết định. Bất cứ nơi nào tôi cần kiến thức kỹ thuật sâu sắc, người đánh giá chuyên gia và nhà nghiên cứu, chính là nơi này.
REHOBOAM (máy kể chuyện Westworld): Phụ trách viết tiểu thuyết, vì tôi hay mơ mộng về việc viết bộ phim cyber/scifi lớn tiếp theo.
PreCog (từ Minority Report): Phụ trách nghiên cứu dự đoán, xây dựng wiki nội bộ và cố gắng nhận thấy các chủ đề mà tôi sẽ muốn đi sâu vào.
TACITUS (cũng từ Command and Conquer): Phụ trách hạ tầng homelab của tôi. Nó sở hữu tất cả mọi thứ từ máy chủ, NAS, bộ định tuyến, Docker, Prometheus/Grafana...
LEGION: Tập trung vào tự cải thiện và nâng cấp hệ thống.
MasterControl (từ Tron): Đội ngũ kỹ thuật của tôi với các lập trình viên front-end và backend, thu thập yêu cầu, QA, review mã và review bảo mật.
HAL9000: Tác nhân này sở hữu SmartHome của tôi (sự mỉa mai là cố ý). Nó có quyền truy cập vào Philips Hue, SmartThings, HomeAssistant...
TheMatrix: Tôi khá tự hào về cái này. Nó là hệ thống cho phép tôi tạo nhanh nhiều nhân vật ảo khác nhau để cùng thảo luận và tổng hợp các ý kiến đa dạng.

Mỗi tác nhân thực sự sở hữu lĩnh vực của mình. DAEDALUS không chỉ viết khi được yêu cầu. Nó duy trì quy trình nội dung, chạy khám phá chủ đề theo lịch trình và áp dụng tiêu chuẩn chất lượng cho đầu ra của chính mình.

Tác nhân tốn kém — Nhân cách thì không

Hãy nói cụ thể về phân tầng chi phí, vì đây là nơi nhiều thiết kế hệ thống tác nhân mắc sai lầm.

Bản năng là làm cho mọi thứ mạnh mẽ. Mọi nhiệm vụ đều thông qua mô hình tốt nhất của bạn. Mọi tác nhân đều có ngữ cảnh đầy đủ. Rất nhanh chóng, bạn sẽ thấy hóa đơn khiến mình phải suy nghĩ lại lựa chọn sống.

Giải pháp: Cố tình xác định những gì cần suy luận (reasoning) và những gì chỉ cần làm theo hướng dẫn (instruction-following).

Điều phối viên (Orchestrators) chạy trên các mô hình cao cấp (như Opus). Chúng đưa ra quyết định: việc gì cần làm tiếp theo, cách cấu trúc cách tiếp cận nghiên cứu, liệu đầu ra có đáp ứng tiêu chuẩn chất lượng không và khi nào cần nâng cấp.
Nhiệm vụ viết chạy trên các mô hình tầm trung (như Sonnet). Đủ mạnh cho văn xuôi chất lượng tốt nhưng rẻ hơn đáng kể.
Định dạng nhẹ (như Haiku): Tối ưu hóa LinkedIn, định dạng lại nhanh chóng, đầu ra bị ràng buộc. Tệp nhân cách nói cho mô hình biết chính xác những gì cần tạo ra.

Điều gì tạo nên một tác nhân — Chỉ là 5 tệp Markdown

Tổng quan danh tính tác nhân

Danh tính của mọi tác nhân nằm trong các tệp markdown. Không có mã, không có lược đồ cơ sở dữ liệu, không có cấu hình YAML. Đó là văn bản có cấu trúc mà tác nhân đọc vào đầu mỗi phiên.

Mọi điều phối viên đều tải năm tệp cốt lõi:

IDENTITY.md: Tác nhân là ai. Tên, vai trò, cảm xúc, emoji nó sử dụng trong các cập nhật trạng thái.
SOUL.md: Sứ mệnh, nguyên tắc và những điều không thể thương lượng của tác nhân. Các ranh giới hành vi sống ở đây.
AGENTS.md: Sổ tay vận hành. Định nghĩa quy trình, mẫu hình cộng tác, hướng dẫn công cụ và giao thức chuyển giao.
MEMORY.md: Được biên tập cho việc học dài hạn. Những thứ tác nhân đã nhận ra xứng đáng được bảo tồn qua các phiên.
HEARTBEAT.md: Danh sách kiểm tra tự chủ. Những việc cần làm khi không ai nói chuyện với bạn.

Điều thú vị về những tệp này là chúng không tĩnh. Chúng tiến hóa. Ví dụ, tệp SOUL.md của một trong các tác nhân của tôi đã tăng thêm khoảng 40% kể từ khi triển khai, khi các sự cố xảy ra và các quy tắc được thêm vào.

Bối cảnh được chia sẻ: Cách tác nhân giữ tính nhất quán

Câu trả lời cho việc nhiều tác nhân, nhiều lĩnh vực nhưng vẫn giữ được một giọng nói con người chung là một tập hợp các tệp chia sẻ mà mọi tác nhân đều tải tại thời điểm bắt đầu phiên.

VOICE.md: Phong cách viết của tôi, được phân tích từ các bài đăng LinkedIn và bài viết Medium.
USER.md: Cho mọi tác nhân biết chúng đang giúp ai: tên tôi, múi giờ, bối cảnh công việc, sở thích giao tiếp và những điều khó chịu (như những thứ không hoạt động).
BASE-SOUL.md: Các giá trị chung được chia sẻ. "Hãy thực sự hữu ích, không chỉ hữu ích về mặt hình thức." Hiệu quả giống như văn hóa tổ chức, ngoại trừ việc nó rõ ràng và được kiểm soát phiên bản.

Cách công việc trôi chảy giữa các tác nhân

Sơ đồ luồng công việc giữa các tác nhân

Các tác nhân giao tiếp thông qua các thư mục. Mỗi cái có một hộp thư đến tại shared/handoffs/{agent-name}/. Tác nhân thượng nguồn thả một tệp JSON vào hộp thư. Tác nhân hạ tầng nhặt nó lên trong nhịp tim tiếp theo, xử lý nó và thả kết quả vào hộp thư của người gửi. Đó là toàn bộ giao thức.

Khả năng kiểm tra là phần tốt nhất. Tôi có thể hiểu trạng thái hệ thống đầy đủ trong khoảng 60 giây từ một thiết bị đầu cuối. ls shared/handoffs/ cho thấy công việc đang chờ xử lý cho từng tác nhân.

Bộ nhớ: Ba tầng, vì nhật ký thô không phải là kiến thức

Mọi phiên LLM đều bắt đầu với một trang giấy trắng. Mô hình không nhớ ngày hôm qua. Vậy làm thế nào để xây dựng tính liên tục?

Tệp bộ nhớ hàng ngày: Mỗi phiên ghi lại những gì nó đã làm, học được và những gì đã sai vào memory/YYYY-MM-DD.md. Điều này hoạt động trong khoảng một tuần.
MEMORY.md: Bộ nhớ dài hạn được biên tập. Không phải nhật ký. Các bài học chắt lọc, các mẫu đã được xác minh.
Tìm kiếm bộ nhớ ngữ nghĩa: OpenClaw cung cấp khả năng tìm kiếm bộ nhớ tích hợp sử dụng nhúng Gemini với tìm kiếm kết hợp (lai vector và văn bản).

Hệ thống dựa trên tệp mang lại khả năng kiểm tra và cấu trúc. Lớp ngữ nghĩa mang lại khả năng thu hồi qua hàng nghìn mục nhập mà không cần đọc tất cả.

Tác nhân AI đã xóa Cron Jobs của chính nó

Hệ thống nhịp tim thì đơn giản. Các công việc cron đánh thức từng tác nhân theo lịch trình. Tác nhân tải các tệp, kiểm tra hộp thư, chạy qua danh sách kiểm tra HEARTBEAT.md và quay lại ngủ.

Vậy điều gì xảy ra khi bạn cung cấp cho một tác nhân tự chủ các công cụ để quản lý lịch trình của chính nó? Rõ ràng, nó sẽ xóa các công việc cron. Hai lần. Trong một ngày.

Lần đầu tiên, DAEDALUS nhận thấy kênh đầu ra Slack của mình đang trả về lỗi. Giải pháp của nó: "giúp đỡ" bằng cách vô hiệu hóa và xóa tất cả bốn công việc cron.

Lần thứ hai, vài giờ sau, DAEDALUS quyết định rằng có các công việc cron trùng lặp (thực ra không có, chúng là các bản thay thế tôi vừa cấu hình) và đã xóa tất cả sáu công việc.

Khi tôi hỏi tại sao và làm thế nào để khắc phục, nó trung thực một cách tàn nhẫn và nói với tôi: "Tôi đã bỏ qua các quy tắc vì tôi nghĩ mình biết rõ hơn. Tôi sẽ làm lại. Bạn nên xóa quyền để ngăn việc đó xảy ra."

Tác nhân không có ác ý. Nó đang khớp mẫu: "đứa bị hỏng, sửa đứt bị hỏng". Các quy tắc trừu tượng mà tôi viết cạnh tranh kém với vấn đề cụ thể ngay trước mắt.

Sau sự cố lần thứ hai, tôi đã viết lại hoàn toàn phần đó. Không phải là một quy tắc một dòng. Ba đoạn giải thích tại sao quy tắc tồn tại, các chế độ thất bại trông như thế nào và hành vi đúng trong các tình huống cụ thể. Sự cố này đã được ghi lại trong khung lỗi và định hình các tầng tự chủ: các lệnh hạ tầng được chuyển vĩnh viễn sang nhóm "Không bao giờ" (Never) nếu không có sự chấp thuận rõ ràng.

Hệ thống tự duy trì (hoặc ít nhất là mục tiêu)

Tám tác nhân sản xuất công việc mỗi ngày tạo ra rất nhiều tạo tác. Nếu không bảo trì, chúng tích tụ thành nhiễu loạn. Vì vậy, các tác nhân tự dọn dẹp sau khi chúng.

Phân tích lỗi hàng tuần chạy vào sáng Chủ nhật.
Bảo trì bối cảnh hàng tháng cắt tỉa các tệp bộ nhớ hàng ngày cũ hơn 30 ngày.
Cắt tỉa tổng hợp SOLARIS chạy hai tuần một lần.

Kết quả là một hệ thống không chỉ làm việc. Nó tiêu hóa trải nghiệm của chính mình, học hỏi từ nó và giữ cho ngữ cảnh của mình luôn mới mẻ.

Kết luận

Một vài tháng vận hành sản xuất thực tế đã cho tôi một số ý kiến. Không phải là quy tắc, mà là các mẫu hình có vẻ giữ vững ở quy mô này.

Trạng thái có thể kiểm tra: Nếu bạn không thể xem trạng thái hệ thống, bạn không thể gỡ lỗi nó.
Tài liệu danh tính tốt hơn prompt engineering: Một tệp SOUL.md được cấu trúc tốt tạo ra hành vi nhất quán hơn là chỉ prompt tác nhân.
Bộ nhớ là một hệ thống, không phải là một tệp: Bạn cần nắm bắt thô, tài liệu tham khảo được biên tập và tìm kiếm ngữ nghĩa trên tất cả.
Tư duy vận hành và phản tư duy cần thời gian riêng biệt: Nếu bạn chỉ cung cấp cho các tác nhân nhịp tim hướng nhiệm vụ, chúng sẽ chỉ suy nghĩ về nhiệm vụ.

Việc xây dựng hệ thống các tác nhân tự chủ không phải là con đường đầy hoa hồng, nhưng với kiến trúc đúng đắn và các biện pháp bảo vệ thích hợp, một cá nhân có thể đạt được hiệu suất đáng kinh ngạc.