Workshop: Công cụ mã nguồn mở giúp gỡ lỗi và đánh giá AI Agent trực tiếp trên máy tính

Raindrop AI vừa ra mắt Workshop, công cụ mã nguồn mở giúp các nhà phát triển gỡ lỗi và đánh giá AI Agent ngay tại máy tính. Công cụ lưu trữ dữ liệu trong một tệp .db nhẹ, giải quyết vấn đề độ trễ và quyền riêng tư dữ liệu.

Startup Raindrop AI vừa tung ra công cụ mới mang tên Workshop, một giải pháp mã nguồn mở (giấy phép MIT) được thiết kế để giúp các nhà phát triển gỡ lỗi và đánh giá AI Agent ngay tại máy tính cục bộ. Công cụ này đáp ứng nhu cầu cấp thiết trong kỷ nguyên AI tự chủ (agentic AI), cho phép lập trình viên theo dõi toàn bộ hoạt động của tác nhân AI thông qua một tệp cơ sở dữ liệu SQL (.db) nhẹ và đơn giản.

Workshop hoạt động như một daemon và giao diện người dùng cục bộ, truyền trực tiếp mọi token, lệnh gọi công cụ (tool call) và quyết định đến một bảng điều khiển tại địa chỉ localhost:5899 ngay khi sự kiện đó xảy ra. Bằng cách truy cập vào localhost này, các nhà phát triển có thể nhìn thấy toàn bộ hành động của AI Agent, bao gồm cả các lỗi sai, từ đó xác định chính xác vấn đề xảy ra ở đâu, khi nào và lý do tại sao. Theo Ben Hylak, đồng sáng lập và CTO của Raindrop AI (cựu kỹ sư Apple và SpaceX), mọi dữ liệu đều được lưu trữ trong một tệp .db duy nhất, chiếm rất ít bộ nhớ.

Việc truyền dữ liệu thời gian thực (real-time telemetry) này giúp loại bỏ độ trễ của các phương pháp thăm dò truyền thống và giải quyết mối lo ngại ngày càng tăng của các nhà phát triển về quyền riêng tư khi phải gửi dữ liệu dấu vết (traces) cục bộ đến các máy chủ bên ngoài.

Cài đặt và hoạt động

Công cụ này có sẵn trên các hệ điều hành macOS, Linux và Windows. Người dùng có thể cài đặt Workshop thông qua một dòng lệnh shell duy nhất, tự động hóa việc đặt tệp nhị phân và cấu hình PATH cho các shell như bash, zsh và fish. Đối với những nhà phát triển thích xây dựng từ mã nguồn, kho lưu trữ dự án được lưu trữ trên GitHub và sử dụng thời gian chạy Bun.

Tính năng nổi bật: Vòng lặp đánh giá tự phục hồi

Điểm nổi bật nhất của nền tảng này là "vòng lặp đánh giá tự phục hồi" (self-healing eval loop). Tính năng này cho phép các tác nhân lập trình như Claude Code đọc các dấu vết hoạt động, viết các bài đánh giá (evals) đối với mã nguồn và tự động sửa chữa mã bị hỏng.

Trong một ứng dụng thực tế, nếu một tác nhân trợ lý thú y không hỏi các câu hỏi theo dõi cần thiết, Workshop sẽ ghi lại toàn bộ quỹ đạo hoạt động đó. Claude Code sau đó sẽ đọc dấu vết này, viết một bài đánh giá cụ thể, xác định lỗi logic trong prompt hoặc mã, và chạy lại tác nhân cho đến khi tất cả các khẳng định (assertions) được thông qua.

Khả năng tương thích và tích hợp hệ sinh thái

Workshop tương thích với nhiều ngôn ngữ lập trình phổ biến, bao gồm TypeScript, Python, Rust và Go.

Công cụ này tích hợp với các SDK và framework hàng đầu như Vercel AI SDK, OpenAI, Anthropic, LangChain, LlamaIndex và CrewAI. Nó cũng được thiết kế để hoạt động trơn tru với nhiều tác nhân lập trình khác nhau, bao gồm Claude Code, Cursor, Devin và OpenCode.

Giấy phép và tác động cộng đồng

Workshop được phát hành theo Giấy phép MIT, đảm bảo công cụ này luôn miễn phí và mã nguồn mở cho tất cả người dùng. Giấy phép phép này nhằm thúc đẩy sự đóng góp từ cộng đồng và cho phép người dùng doanh nghiệp duy trì chủ quyền dữ liệu.

Ông Hylak chia sẻ trên X rằng công cụ này được xây dựng để cung cấp một cách "hợp lý" để gỡ lỗi các tác nhân tại địa phương, thay đổi cách đội ngũ của ông và những khách hàng sớm xây dựng các hệ thống tự chủ. Để kỷ niệm sự ra mắt, Raindrop đã tặng quà vật phẩm phiên bản giới hạn cho những người dùng cài đặt công cụ và thực hiện một lệnh "drip" cụ thể.