Giới thiệu Libretto: Công cụ giúp tác nhân AI tạo ra các kịch bản tự động hóa trình duyệt xác định và dễ dàng bảo trì
Libretto là một bộ công cụ mới giúp chuyển đổi từ việc sử dụng AI tại thời điểm chạy sang AI tại thời điểm phát triển, cho phép tạo ra các kịch bản tự động hóa trình duyệt bằng Playwright thực tế. Công cụ này giải quyết vấn đề độ tin cậy và chi phí khi tích hợp với các hệ thống web phức tạp bằng cách kết hợp tự động hóa giao diện người dùng và các yêu cầu mạng trực tiếp.
Giới thiệu Libretto: Công cụ giúp tác nhân AI tạo ra các kịch bản tự động hóa trình duyệt xác định và dễ dàng bảo trì
Libretto là một bộ công cụ Skill + CLI mới được thiết kế để hỗ trợ các tác nhân lập trình (coding agents) tạo ra các kịch bản tự động hóa trình duyệt mang tính xác định (deterministic) và dễ dàng debug. Thay vì phụ thuộc vào các tác nhân hoạt động tại thời điểm chạy (runtime agents) vốn khó kiểm soát, Libretto cho phép các nhà phát triển sử dụng AI để tạo ra các đoạn mã thực tế có thể đọc, kiểm soát và bảo trì.
NPM Version
Thách thức với các công cụ tự động hóa hiện tại
Hiện tại, nhiều công cụ như Browseruse hay Stagehand sử dụng phương pháp "AI thời gian chạy", nơi bạn đưa ra một câu lệnh (prompt) và hy vọng tác nhân tự tìm ra cách thực hiện. Tuy nhiên, phương pháp này gặp nhiều hạn chế:
- Phụ thuộc vào phân tích DOM tùy chỉnh: Điều này thường không ổn định trên các trang web cũ hoặc phức tạp, đặc biệt là trong lĩnh vực y tế.
- Chi phí cao: Yêu cầu nhiều lệnh gọi AI và không thể luôn dựa vào bộ nhớ đệm (caching) cho các quy trình logic phức tạp.
- Tính minh bạch thấp: Bạn không biết chắc chắn tác nhân sẽ làm gì tại thời điểm chạy, rất khó để debug khi thất bại.
Libretto giải quyết vấn đề này bằng cách áp dụng "AI thời gian phát triển" (development-time AI). Các kịch bản được tạo ra trước dưới dạng mã thực tế, cho phép bạn sở hữu, kiểm tra, sửa đổi và gỡ lỗi mọi thứ một cách minh bạch.
Cách tiếp cận lai của Libretto
Điểm khác biệt chính của Libretto nằm ở cách nó xử lý tương tác trình duyệt. Thay vì chỉ dựa vào phân tích DOM, Libretto sử dụng phương pháp lai kết hợp tự động hóa giao diện người dùng Playwright với các yêu cầu mạng (network/API) trực tiếp trong phiên trình duyệt.
License MIT
Cách tiếp cận này mang lại lợi ích lớn về tốc độ, độ tin cậy và khả năng tránh bị phát hiện là bot. Libretto cũng có khả năng ghi lại các thao tác thủ công của người dùng để giúp tác nhân tạo và cập nhật kịch bản, hỗ trợ debug từng bước (step-through), và có chế độ chỉ đọc (read-only) để ngăn chặn việc sửa đổi dữ liệu vô tình.
Các trường hợp sử dụng điển hình
Libretto được thiết kế để hoạt động như một kỹ năng (skill) cho các tác nhân lập trình của bạn. Dưới đây là một số ví dụ về cách sử dụng:
- Tạo kịch bản một lần: Yêu cầu tác nhân truy cập LinkedIn và lấy dữ liệu 10 bài đăng đầu tiên cùng với thông tin tương tác. Libretto sẽ mở trình duyệt để bạn đăng nhập, sau đó tự động khám phá và tạo mã.
- Chuyển đổi tự động hóa trình duyệt sang yêu cầu mạng: Chuyển đổi một kịch bản Playwright hiện có thành các kịch bản gọi API trực tiếp. Libretto có thể phân tích lưu lượng mạng để đảo ngược kỹ thuật API của trang web, giúp quá trình chạy nhanh hơn và ổn định hơn.
- Sửa chữa tích hợp hỏng: Khi một kịch bản gặp lỗi (ví dụ: lỗi bộ chọn), tác nhân có thể sử dụng Libretto để tái tạo lỗi, dừng quy trình, kiểm tra trang trực tiếp và tự động sửa chữa.
Cài đặt và bắt đầu
Libretto được phát hành dưới dạng mã nguồn mở bởi đội ngũ của Saffron Health sau một năm xây dựng và duy trì các tích hợp trình duyệt cho các phần mềm y tế.
Để cài đặt, bạn có thể sử dụng npm:
npm install libretto
Sau đó, chạy lệnh thiết lập ban đầu để cài đặt kỹ năng, tải xuống Chromium và cấu hình mô hình phân tích mặc định:
npx libretto setup
Libretto tự động phát hiện thông tin đăng ký của nhà cung cấp (như OPENAI_API_KEY) từ các biến môi trường hoặc tệp .env. Tất cả trạng thái và cấu hình của Libretto được lưu trong thư mục .libretto/ tại gốc dự án của bạn.
Discord
Nếu bạn quan tâm đến việc xây dựng và duy trì tự động hóa trình duyệt một cách đáng tin cậy trong các môi trường phức tạp, Libretto là một công cụ hứa hẹn giúp giảm bớt gánh nặng bảo trì và tăng tính minh bạch cho quy trình phát triển.
Bài viết liên quan

Phần mềm
Anthropic ra mắt Claude Opus 4.7: Nâng cấp mạnh mẽ cho lập trình nhưng vẫn thua Mythos Preview
16 tháng 4, 2026

Công nghệ
Qwen3.6-35B-A3B: Quyền năng Lập trình Agentic, Nay Đã Mở Cửa Cho Tất Cả
16 tháng 4, 2026

Công nghệ
Spotify thắng kiện 322 triệu USD từ nhóm pirate Anna's Archive nhưng đối mặt với bài toán thu hồi
16 tháng 4, 2026
