Web Scroller Tool: Công cụ mã nguồn mở giúp quay video trang web tự động
Web Scroller Tool là một tiện ích dòng lệnh mới cho phép người dùng tạo video MP4 chất lượng cao từ việc cuộn trang web. Sử dụng kết hợp Headless Chrome và ffmpeg, công cụ này hỗ trợ kịch bản phức tạp bao gồm nhấp chuột, gõ phím và tạm dừng, lý tưởng để tạo tài liệu hướng dẫn hoặc demo sản phẩm.

Web Scroller Tool là một công cụ mã nguồn mở thú vị được phát triển bởi Đại học Pennsylvania (Upenn), cho phép người dùng tự động hóa việc quay video quá trình cuộn (scroll) của một trang web. Công cụ này hoạt động bằng cách mở URL trong trình duyệt Chrome không giao diện (headless), chụp ảnh màn hình tại các vị trí cuộn cố định và truyền các khung hình đó vào ffmpeg để tạo ra video MP4.
Đây là giải pháp hữu ích cho những người cần tạo bản ghi màn hình chất lượng cao, demo sản phẩm hoặc tài liệu hướng dẫn kỹ thuật mà không cần can thiệp thủ công.
Tính năng nổi bật
Điểm mạnh nhất của Web Scroller Tool nằm ở khả năng kiểm soát chi tiết quá trình quay video thông qua các tệp "cue sheet" (tập lệnh). Thay vì chỉ cuộn đơn thuần từ trên xuống dưới, người dùng có thể lập trình một chuỗi hành động phức tạp.
Các hành động được hỗ trợ bao gồm:
- Cuộn trang: Cuộn đến đáy, đến một vị trí cụ thể (theo pixel hoặc văn bản), hoặc cuộn một khoảng cách nhất định với tốc độ tùy chỉnh.
- Tương tác: Mô phỏng nhấp chuột (click), gõ phím (type) và nhấn phím.
- Hiệu ứng: Tạm dừng (pause), phóng to/thu nhỏ (zoom), và làm nổi bật (highlight) các phần tử văn bản.
- Tùy chỉnh: Cho phép hiển thị hoặc ẩn con trỏ chuột, điều chỉnh độ phân giải (mặc định 1080p), khung hình/giây (fps) và chất lượng video.
Cách thức hoạt động
Công cụ sử dụng Node.js để điều khiển phiên bản Chrome tạm thời với DevTools được bật. Nó tải trang web, thực hiện các lệnh trong cue sheet (nếu có), chụp các khung hình PNG và chuyển trực tiếp cho ffmpeg để mã hóa thành định dạng H.264 MP4.
Trong chế độ cuộn một lần (one-shot), công cụ đảm bảo tốc độ cuộn ổn định bất kể thời gian chụp ảnh từng khung hình. Trong chế độ cue sheet, các hoạt động được tính thời gian chính xác để các hiệu ứng động trên trang web vẫn diễn ra tự nhiên trong video.
Sử dụng Cue Sheet để tự động hóa
Cue sheet là các tệp văn bản đơn giản định nghĩa kịch bản video. Ví dụ, bạn có thể yêu cầu công cụ mở trang web, đợi 1 giây, nhấp vào nút "Blog", sau đó cuộn chậm xuống dưới cùng.
Ví dụ một đoạn cue sheet cơ bản:
out: demo.mp4
width: 1920
height: 1080
fps: 60
cursor: on
go https://example.com
pause 1
click "Blog"
scroll to bottom over 5
Khi chạy lệnh render, công cụ sẽ thực hiện tuần tự các bước này để tạo ra video hoàn chỉnh.
Cài đặt và yêu cầu hệ thống
Để sử dụng Web Scroller Tool, máy tính của bạn cần cài đặt sẵn:
- Node.js phiên bản 22 hoặc mới hơn.
- Google Chrome, Chromium hoặc Microsoft Edge.
- ffmpeg để xử lý video.
Quá trình cài đặt khá đơn giản và có thể thực hiện thông qua npm hoặc git clone. Công cụ cũng cung cấp khả năng tích hợp với Codex CLI của OpenAI, cho phép người dùng cài đặt và chạy skill này bằng ngôn ngữ tự nhiên.
Web Scroller Tool được cấp phép theo MIT, hoàn toàn miễn phí và mã nguồn mở. Đây là một công cụ giá trị trong bộ dụng cụ của các lập trình viên, chuyên gia QA và nhà sáng tạo nội dung kỹ thuật số.
Bài viết liên quan

Phần mềm
K3k: Công cụ chạy Kubernetes trong Kubernetes giúp tối ưu hóa tài nguyên và đa thuê
02 tháng 5, 2026

Công nghệ
Agent Desktop: "Playwright" cho ứng dụng máy tính, giúp AI Agents tiết kiệm 80% token
02 tháng 5, 2026

Phần mềm
Governor: Plugin tối ưu hóa token và ngữ cảnh cho Claude Code
02 tháng 5, 2026
