Rotunda: Trình duyệt Firefox được tối ưu hóa cho các tác nhân AI với khả năng giả lập con người

Phần mềm13 tháng 5, 2026·4 phút đọc

Rotunda là một bản fork của Firefox được xây dựng đặc biệt để phục vụ các tác nhân AI, giải quyết vấn đề phát hiện bot thường gặp khi tự động hóa trình duyệt. Công cụ này sử dụng mạng nơ-ron (RNN) để mô phỏng hành vi con người như di chuyển chuột và gõ phím, thay vì cố gắng giả mạo hoàn toàn cấu hình phần cứng.

Rotunda: Trình duyệt Firefox được tối ưu hóa cho các tác nhân AI với khả năng giả lập con người

Trong bối cảnh các mô hình sử dụng máy tính (computer use models) ngày càng phổ biến nhưng chi phí vận hành vẫn còn cao, việc trao quyền cho các tác nhân AI khả năng điều khiển trình duyệt là một giải pháp đầy tiềm năng. Tuy nhiên, việc sử dụng các công cụ tự động hóa truyền thống như Chrome DevTools Protocol (CDP) thường dẫn đến việc bị các website chặn bằng CAPTCHA hoặc phát hiện là bot do rò rỉ trạng thái điều khiển.

Rotunda HeaderRotunda Header

Rotunda ra đời như một giải pháp thay thế, là một bản fork của Firefox được thiết kế "từ đầu" dành riêng cho các tác nhân. Dự án do Pierce phát triển nhằm giải quyết bài toán làm thế nào để các tác nhân AI có thể điều khiển trình duyệt mà không bị nhận diện là phần mềm độc hại.

Mô phỏng hành vi con người chân thực

Điểm khác biệt lớn nhất của Rotunda nằm ở khả năng mô phỏng hành vi con người một cách tự nhiên. Thay vì điền dữ liệu vào các trường biểu mẫu ngay lập tức hay di chuyển chuột nhảy cóc như các script tự động hóa thông thường, Rotunda sử dụng một mạng nơ-ron hồi quy (RNN) đã được huấn luyện trên chính thói quen gõ phím và di chuột của tác giả trong một tuần.

Điều này giúp các tác nhân AI thực hiện các thao tác như gõ phím (có cả lỗi đánh máy ngẫu nhiên và tốc độ gõ không đều) cũng như di chuyển chuột mượt mà, khiến các hệ thống phát hiện bot khó có thể phân biệt được với người dùng thật.

Chiến lược "Stealth" thông minh

Hầu hết các trình duyệt ẩn danh (stealth browser) hiện nay cố gắng giả mạo cấu hình phần cứng và trình duyệt để lẩn trốn. Tuy nhiên, theo quan điểm của nhà phát triển Rotunda, việc nói dối hoàn toàn về dấu vân tay trình duyệt (browser fingerprint) là vô vọng về mặt thống kê, bởi vì chỉ cần một bất thường nhỏ cũng đủ để hệ thống phát hiện ra bạn đang giả mạo.

Rotunda chọn cách tiếp cận khác: trung thực về thông số máy chủ (host specs) nhưng chỉ "nói dối nhỏ" về một số chi tiết phía máy khách như phông chữ, kích thước màn hình hoặc tiện ích mở rộng. Chiến lược này giúp tránh bị gắn cờ là bot do sự bất thường trong cấu hình giả mạo, đồng thời vẫn giữ được sự ẩn danh cần thiết để hoạt động trơn tru.

Tích hợp và sử dụng dễ dàng

Rotunda hoạt động cục bộ trên thiết bị của người dùng và có thể được điều khiển thông qua API Playwright hoặc dòng lệnh (CLI). Điều này cho phép các nhà phát triển dễ dàng tích hợp vào các dự án Python hiện có hoặc sử dụng với các công cụ harness như Claude, Codex.

Ví dụ về cách khởi tạo Rotunda với Playwright:

from playwright.sync_api import sync_playwright
from rotunda import NewBrowser, NewContext

with sync_playwright() as playwright:
    browser = NewBrowser(playwright, headless=False)
    context = NewContext(browser)
    page = context.new_page()
    page.goto("https://example.com")
    # Các tác nhân AI có thể tương tác với page ở đây
    browser.close()

Rotunda DemoRotunda Demo

Ngoài ra, Rotunda còn cung cấp một bộ lệnh CLI mạnh mẽ cho phép điều khiển trình duyệt mà không cần viết mã phức tạp, bao gồm các lệnh như navigate, click, type, scroll, và screenshot. Các lệnh này giúp duy trì các phiên trình duyệt và hồ sơ dưới thư mục ~/.rotunda, cho phép các quy trình khác nhau kết nối lại cùng một hồ sơ.

Tầm nhìn và tương lai

Rotunda không phù hợp cho việc thu thập dữ liệu web (crawling) quy mô lớn trên đám mây, nhưng lại cực kỳ hữu ích khi bạn ủy quyền các tác vụ cụ thể cho các tác nhân AI trên mạng nội bộ của mình. Nó giống như việc bạn có một đội ngũ thực tập sinh ảo làm việc trên mạng gia đình thay vì các bot thu thập dữ liệu vô hồn.

Dự án hiện đang ở giai đoạn phát triển rất sớm, dựa trên các bản vá Firefox hiện đại (phiên bản 150) và được cấp phép mã nguồn mở theo MPL-2.0 trên GitHub. Với việc tập trung vào việc làm cho các tác nhân AI hoạt động giống con người hơn là cố gắng đánh lừa hệ thống bằng các kỹ thuật giả mạo phức tạp, Rotunda mở ra một hướng đi mới mẻ cho tự động hóa web thông minh.

Chia sẻ:FacebookX
Nội dung tổng hợp bằng AI, mang tính tham khảo. Xem bài gốc ↗