Dirac: Agent AI mã nguồn mở dẫn đầu TerminalBench 2.0, hiệu suất vượt trội và chi phí thấp

27 tháng 4, 2026·4 phút đọc

Dirac, một agent AI mã nguồn mở mới, đã ghi nhận điểm số ấn tượng 65.2% trên TerminalBench 2.0 khi sử dụng mô hình Gemini-3-flash-preview, vượt qua cả Google và các giải pháp đóng mã khác. Công cụ này nổi bật nhờ khả năng tối ưu hóa token, giảm chi phí API gần 65% và sử dụng các kỹ thuật chỉnh sửa mã chính xác dựa trên AST để đảm bảo hiệu suất làm việc cao.

Dirac: Agent AI mã nguồn mở dẫn đầu TerminalBench 2.0, hiệu suất vượt trội và chi phí thấp

Dirac là một dự án mã nguồn mở đầy thú vị nhằm mục đích thay đổi cách các nhà phát triển sử dụng AI trong việc lập trình và tái cấu trúc mã nguồn. Được xây dựng dựa trên nhận thức rằng khả năng suy luận của các mô hình ngôn ngữ (LLM) thường suy giảm khi độ dài ngữ cảnh tăng lên, Dirac tập trung vào việc quản lý ngữ cảnh một cách chặt chẽ để nâng cao độ chính xác và giảm thiểu chi phí vận hành.

Dẫn đầu TerminalBench 2.0 với tính minh bạch cao

Mới đây, Dirac đã đạt được kết quả ấn tượng trên bảng xếp hạng TerminalBench 2.0 với điểm số 65.2% khi sử dụng mô hình Gemini-3-flash-preview. Con số này vượt xa mức cơ sở 47.8% của Google và thậm chí còn vượt qua agent hàng đầu hiện nay là Junie CLI (64.3%).

Điều đáng chú ý là kết quả này được đạt hoàn toàn trong sạch. Giữa bối cảnh có nhiều báo cáo về việc gian lận trên các chuẩn mực đánh giá benchmark mới đây, tác giả của Dirac đã khẳng định rõ ràng:

Không hề có bất kỳ tệp {agents/skills}.md nào được chèn vào quá trình chạy. Không có cơ chế gian lận nào cả.

Quá trình chạy thử nghiệm được thực hiện tuân thủ nghiêm ngặt các quy định của leaderboard và sử dụng phiên bản mã nguồn mở đầy đủ, hoàn toàn giống với những gì có sẵn trên GitHub.

Tại sao Dirac lại hiệu quả?

Điểm mạnh cốt lõi của Dirac nằm ở cách nó xử lý và tối ưu hóa mã nguồn. Thay vì chỉ đơn thuần là chat với LLM, Dirac áp dụng các kỹ thuật kỹ thuật sâu để đảm bảo tính chính xác.

Chỉnh sửa song song dựa trên ASTChỉnh sửa song song dựa trên AST

  • Chỉnh sửa chính xác dựa trên AST: Dirac có khả năng hiểu cú pháp ngôn ngữ (TypeScript, Python, C++, v.v.) nhờ vào Cây cú pháp trừu tượng (AST). Điều này cho phép nó thực hiện các thao tác tái cấu trúc phức tạp như trích xuất hàm hoặc sửa đổi lớp với độ chính xác cực cao, tránh các lỗi dịch chuyển số dòng thường thấy.
  • Chỉnh sửa song song neo bằng Hash: Sử dụng hash dòng ổn định để nhắm mục tiêu chỉnh sửa với độ chính xác cực đại.
  • Tối ưu hóa chi phí: Theo các bài kiểm thử trên các kho lưu trữ công khai (GitHub repos), Dirac giảm chi phí API trung bình xuống 64.8% (tương đương giảm 2.8 lần chi phí) so với các đối thủ cạnh tranh như Cline hay Kilo, trong khi vẫn duy trì tỷ lệ hoàn thành nhiệm vụ ấn tượng.

Các tính năng nổi bật khác

Dirac được thiết kế để trở thành một công cụ toàn diện cho lập trình viên hiện đại, cung cấp nhiều tính năng nâng cao giúp tăng năng suất:

Đa chức năng và đọc tệpĐa chức năng và đọc tệp

  • Xử lý đa tệp theo lô: Có thể xử lý và chỉnh sửa nhiều tệp trong một lần gọi LLM (single roundtrip), giúp giảm đáng kể độ trễ và chi phí.
  • Băng thông ngữ cảnh cao: Cơ chế lọc ngữ cảnh giúp LLM luôn nhận được thông tin phù hợp nhất mà không lãng phí token.
  • Công cụ tự chủ: Dirac có thể đọc/ghi tệp, thực thi lệnh terminal, sử dụng trình duyệt ẩn (headless browser) và nhiều công cụ khác, tất cả đều được kiểm soát qua quy trình phê duyệt để đảm bảo an toàn.

Cài đặt và Khởi đầu

Dirac có sẵn dưới dạng tiện ích mở rộng trên VS Code Marketplace và CLI cho các hệ điều hành phổ biến.

Để cài đặt CLI, bạn có thể sử dụng npm:

npm install -g dirac-cli

Sau khi cài đặt, bạn có thể bắt đầu ngay với các lệnh đơn giản:

  • dirac auth: Xác thực tài khoản.
  • dirac "Phân tích kiến trúc của dự án này": Chạy tác vụ đầu tiên.

Dirac là một fork của dự án Cline rất nổi tiếng, được phát triển bởi Max Trivedi tại Dirac Delta Labs và cấp phép theo Apache License 2.0. Với hiệu suất vượt trội và chi phí tối ưu, đây là một công cụ mà các nhà phát triển Việt Nam nên cân nhắc thử nghiệm để cải thiện quy trình làm việc hàng ngày.

Bài viết được tổng hợp và biên soạn bằng AI từ các nguồn tin tức công nghệ. Nội dung mang tính tham khảo. Xem bài gốc ↗