Cloudflare ra mắt Artifacts: Kho lưu trữ phiên bản nói ngôn ngữ Git dành cho AI Agents

16 tháng 4, 2026·7 phút đọc

Cloudflare giới thiệu Artifacts, một hệ thống tệp phân tán có phiên bản được thiết kế riêng cho AI Agents, sử dụng giao thức Git. Giải pháp này cho phép tạo lập kho chứa (repo) theo lập trình, giúp giải quyết vấn đề quy mô khi các tác nhân AI tạo ra lượng mã nguồn khổng lồ.

Cloudflare ra mắt Artifacts: Kho lưu trữ phiên bản nói ngôn ngữ Git dành cho AI Agents

Cloudflare vừa công bố Artifacts, một hệ thống tệp phân tán có phiên bản (versioned filesystem) được thiết kế đặc biệt cho AI Agents, với khả năng "nói" ngôn ngữ Git. Đây là bước tiến quan trọng nhằm giải quyết vấn đề quy mô khi các tác nhân AI tạo ra lượng mã code lớn hơn bao giờ hết, vượt xa khả năng xử lý của các nền tảng kiểm soát mã nguồn truyền thống.

Sự trỗi dậy của các tác nhân AI đã thay đổi hoàn toàn tư duy của chúng ta về kiểm soát mã nguồn, hệ thống tệp và việc duy trì trạng thái. Dự báo rằng lượng mã code được viết ra trong 5 năm tới sẽ nhiều hơn tổng số lượng trong toàn bộ lịch sử lập trình. Các nền tảng kiểm soát mã nguồn hiện nay, vốn được xây dựng để phục vụ con người, đang gặp khó khăn trước sự gia tăng 10 lần về khối lượng công việc từ những AI không bao giờ ngủ và có thể xử lý song hàng nhiều vấn đề cùng lúc.

Kiến trúc của ArtifactsKiến trúc của Artifacts

Artifacts: Kho lưu trữ phiên bản dành cho kỷ nguyên AI

Artifacts được định nghĩa là một hệ thống tệp có phiên bản, giao tiếp thông qua giao thức Git. Nó cho phép các nhà phát triển tạo các kho chứa (repository) theo lập trình, bên cạnh các tác nhân AI, sandbox, Workers hoặc bất kỳ mô hình tính toán nào khác, và kết nối từ bất kỳ máy khách Git thông thường nào.

Bạn muốn cấp một repo cho mỗi phiên làm việc của tác nhân? Artifacts có thể làm được. Mỗi phiên bản sandbox? Không vấn đề gì. Bạn muốn tạo 10.000 bản fork (nhánh) từ một điểm khởi đầu an toàn? Artifacts lại là câu trả lời. Hệ thống này cung cấp REST API và API Workers gốc để tạo kho chứa, tạo thông tin xác thực và commit cho các môi trường mà máy khách Git không phải là lựa chọn phù hợp (ví dụ: trong các hàm serverless).

Hiện tại, Artifacts đang ở giai đoạn bản beta riêng tư dành cho bất kỳ nhà phát triển nào sử dụng gói Workers trả phí, và Cloudflare dự kiến sẽ mở rộng thành bản beta công khai vào đầu tháng 5.

Tại sao lại là Git?

Các tác nhân AI đã rất quen thuộc với Git. Đây là kiến thức sâu sắc trong dữ liệu huấn luyện của hầu hết các mô hình hiện nay. Các đường đi tiêu chuẩn và các trường hợp ngoại lệ đều được AI hiểu rõ, đặc biệt là các mô hình được tối ưu hóa cho code.

Hơn nữa, mô hình dữ liệu của Git không chỉ tốt cho kiểm soát mã nguồn mà còn cho bất kỳ thứ gì cần theo dõi trạng thái, "du hành thời gian" (time travel) và lưu trữ lượng lớn dữ liệu nhỏ. Code, cấu hình, câu lệnh nhắc (prompt) và lịch sử tác nhân đều là những đối tượng mà chúng ta thường muốn lưu trữ thành các phần nhỏ (commit) và có khả năng quay lại trạng thái cũ (history).

Cloudflare cho rằng việc tạo ra một giao thức mới hoàn toàn sẽ gặp phải "vấn đề khởi động" (bootstrap problem). Các mô hình AI không biết giao thức đó, buộc phải phân phối kỹ năng, CLI hoặc hy vọng người dùng kết nối với tài liệu MCP... Tất cả đều tạo ra ma sát. Nếu chỉ cần cung cấp cho tác nhân một URL Git remote HTTPS đã được xác thực và bảo mật, mọi thứ sẽ hoạt động rất trơn tru.

Không chỉ dành cho kiểm soát mã nguồn

Mặc dù API Git của Artifacts có thể khiến bạn nghĩ nó chỉ dành cho kiểm soát mã nguồn, nhưng thực tế API và mô hình dữ liệu của Git là một cách mạnh mẽ để duy trì trạng thái. Nó cho phép bạn fork, du hành thời gian và so sánh trạng thái (diff) cho bất kỳ loại dữ liệu nào.

Bên trong Cloudflare, họ đang sử dụng Artifacts cho các tác nhân nội bộ: tự động lưu trữ trạng thái hiện tại của hệ thống tệp và lịch sử phiên trong một kho Artifacts riêng cho mỗi phiên. Điều này cho phép:

  • Duy trì trạng thái sandbox mà không cần cấp phát (và duy trì) lưu trữ khối (block storage).
  • Chia sẻ phiên với người khác và cho phép họ "du hành thời gian" qua cả trạng thái phiên và trạng thái tệp, bất kể có commit nào đến "kho chứa thực tế" hay không.
  • Fork một phiên từ bất kỳ điểm nào, cho phép đội ngũ chia sẻ phiên với đồng nghiệp để họ có thể tiếp tục công việc từ đó.

Cấu trúc bên trong: Zig và WebAssembly

Artifacts được xây dựng dựa trên Durable Objects. Khả năng tạo ra hàng triệu (hoặc hàng chục triệu) phiên bản tính toán có trạng thái và cô lập là điều cốt lõi của cách Durable Objects hoạt động, và đây chính xác là những gì cần thiết để hỗ trợ hàng triệu kho Git trên mỗi không gian tên (namespace).

Tuy nhiên, Cloudflare cần một triển khai Git có thể chạy trên Cloudflare Workers. Nó cần nhỏ gọn, hoàn chỉnh nhất có thể, có thể mở rộng và hiệu quả. Do đó, họ đã xây dựng một triển khai Git bằng ngôn ngữ Zig và biên dịch nó sang WebAssembly (Wasm).

Quy trình hoạt động của ArtifactsQuy trình hoạt động của Artifacts

Toàn bộ động cơ giao thức git được viết bằng Zig thuần túy (không có libc), biên dịch thành một tệp nhị phân WASM khoảng 100KB. Nó triển khai SHA-1, zlib inflate/deflate, mã hóa/giải mã delta, phân tích gói và giao thức HTTP thông minh của git — tất cả đều được viết từ đầu.

WASM module giao tiếp với máy chủ JS thông qua một giao diện callback mỏng. Bên dưới, Artifacts cũng sử dụng R2 (để tạo snapshot) và KV (để theo dõi mã thông báo xác thực).

ArtifactFS: Giải quyết vấn đề kho chứa lớn

Hầu hết các kho chứa không quá lớn, nhưng với các kho chứa đa GB hoặc có hàng triệu đối tượng, việc clone có thể mất hàng phút. Một khung web phổ biến (kích thước 2,4GB) mất gần 2 phút để clone. Điều này làm chậm tác nhân AI.

Để giải quyết vấn đề này, Cloudflare cũng mã nguồn mở ArtifactFS — một trình điều khiển hệ thống tệp được thiết kế để gắn kết (mount) các kho Git lớn càng nhanh càng tốt. Nó hydrate nội dung tệp theo yêu cầu thay vì chờ quá trình clone ban đầu hoàn tất.

Bạn có thể hình dung ArtifactFS giống như "Git clone nhưng bất đồng bộ (async)":

  • ArtifactFS thực hiện một bản clone "không blob" của kho git: nó tìm nạp cây tệp và refs, nhưng không phải nội dung tệp.
  • Nó có thể thực hiện việc này trong quá trình khởi động sandbox, cho phép hệ thống điều khiển tác nhân bắt đầu làm việc ngay lập tức.
  • Trong nền, nó bắt đầu hydrate (tải xuống) nội dung tệp đồng thời thông qua một daemon nhẹ.
  • Nó ưu tiên các tệp mà tác nhân thường muốn thao tác trước: tệp kê khai (package.json, go.mod), tệp cấu hình và mã code.

ArtifactFS giúp tăng tốc độ khởi độngArtifactFS giúp tăng tốc độ khởi động

Bảng giá và tính khả dụng

Cloudflare đang ở giai đoạn đầu với Artifacts và muốn định giá hoạt động ở quy mô tác nhân: nó cần hiệu quả về chi phí để có hàng triệu repo, các repo không sử dụng không nên trở thành gánh nặng.

  • Hoạt động: $0,15 cho mỗi 1.000 hoạt động (10.000 hoạt động đầu tiên được bao gồm mỗi tháng).
  • Lưu trữ: $0,50/GB-tháng (1GB đầu tiên được bao gồm).

Artifacts hiện đang ở bản beta riêng tư và dự kiến bản beta công khai sẽ sẵn sàng vào đầu tháng 5. Cloudflare cũng có kế hoạch đưa Artifacts vào gói Workers Free (với một số giới hạn hợp lý) khi beta tiến triển.

Bài viết được tổng hợp và biên soạn bằng AI từ các nguồn tin tức công nghệ. Nội dung mang tính tham khảo. Xem bài gốc ↗