Models.dev: Kho dữ liệu mã nguồn mở về thông số, giá cả và khả năng của các mô hình AI

AI & ML22 tháng 5, 2026·4 phút đọc

Models.dev là một dự án mã nguồn mở cung cấp cơ sở dữ liệu toàn diện về thông số kỹ thuật, định giá và khả năng của các mô hình AI hiện nay. Dự án này cho phép cộng đồng đóng góp dữ liệu thông qua các tệp TOML và cung cấp API để truy cập thông tin dễ dàng.

Models.dev: Kho dữ liệu mã nguồn mở về thông số, giá cả và khả năng của các mô hình AI

Models.dev là một cơ sở dữ liệu mã nguồn mở toàn diện tập trung vào các thông số kỹ thuật, định giá và khả năng của các mô hình AI. Trong bối cảnh thị trường trí tuệ nhân tạo phát triển như vũ bão, việc thiếu một nguồn dữ liệu tập trung về tất cả các mô hình hiện hữu là một khoảng trống lớn. Models.dev được khởi tạo như một dự án đóng góp từ cộng đồng để giải quyết vấn đề này, đồng thời được đội ngũ phát triển sử dụng nội bộ cho dự án opencode.

API và Truy cập dữ liệu

Người dùng và nhà phát triển có thể truy cập dữ liệu này thông qua API công khai. Chỉ cần sử dụng lệnh curl đơn giản, bạn có thể lấy toàn bộ dữ liệu JSON:

curl https://models.dev/api.json

Mỗi mô hình đều có một Model ID duy nhất, đóng vai trò là định danh được sử dụng bởi AI SDK để tra cứu thông tin. Ngoài ra, dự án còn cung cấp các logo của nhà cung cấp dưới dạng tệp SVG, giúp việc tích hợp vào giao diện người dùng trở nên thuận tiện hơn.

Đóng góp vào dự án

Dữ liệu của Models.dev được lưu trữ trong kho repository dưới dạng các tệp TOML, được tổ chức theo từng nhà cung cấp (provider) và mô hình. Để duy trì tính chính xác và cập nhật, dự án rất cần sự đóng góp từ cộng đồng.

Thêm một Nhà cung cấp mới

Nếu nhà cung cấp chưa tồn tại trong thư mục providers/, bạn cần thực hiện các bước sau:

  1. Tạo một thư mục mới cho nhà cung cấp (ví dụ: providers/newprovider/).
  2. Thêm tệp provider.toml chứa chi tiết như tên, gói npm, biến môi trường dùng để xác thực và liên kết tài liệu.
  3. Đối với các nhà cung cấp có endpoint tương thích OpenAI nhưng không phát hành gói npm riêng, cần cấu hình trường npm@ai-sdk/openai-compatible và cung cấp URL cơ sở.

Logo của nhà cung cấp nên được thêm dưới dạng tệp SVG vào thư mục tương ứng. Dự án khuyến nghị sử dụng định dạng SVG không có kích thước cố định hoặc màu sắc cứng, thay vào đó hãy sử dụng currentColor để đảm bảo tính linh hoạt khi hiển thị.

Định nghĩa Mô hình mới

Để thêm một mô hình mới, bạn cần tạo một tệp TOML trong thư mục models/ của nhà cung cấp. Tên tệp sẽ là Model ID. Tệp này chứa các thông tin quan trọng như:

  • Thông tin cơ bản: Tên hiển thị, ngày phát hành, ngày cập nhật cuối cùng, ngày cắt bỏ kiến thức (knowledge-cutoff).
  • Khả năng kỹ thuật: Hỗ trợ đính kèm tệp, suy luận (reasoning), gọi công cụ (tool calling), đầu ra có cấu trúc, kiểm soát nhiệt độ (temperature).
  • Chi phí (Cost): Giá cho mỗi triệu token đầu vào, đầu ra, suy luận, và các loại token cache hoặc âm thanh.
  • Giới hạn (Limit): Kích thước cửa sổ ngữ cảnh tối đa, số token đầu vào/đầu ra tối đa.
  • Phương thức (Modalities): Các loại dữ liệu đầu vào và đầu ra được hỗ trợ (văn bản, hình ảnh, âm thanh, video, PDF).

Dự án cũng hỗ trợ tính năng extends, cho phép tái sử dụng định nghĩa của một mô hình gốc cho các nhà cung cấp bao bọc (wrapper), giúp giảm thiểu sự trùng lặp mã nguồn.

Validation và Kiểm thử

Models.dev sử dụng GitHub Action để tự động xác thực các bài gửi (Pull Request), đảm bảo rằng tất cả các trường bắt buộc đều có mặt, kiểu dữ liệu đúng và cú pháp TOML hợp lệ. Đối với những người muốn phát triển giao diện frontend, dự án hỗ trợ chạy cục bộ bằng Bun. Ngoài ra, bạn cũng có thể kiểm tra thay đổi của nhà cung cấp thủ công thông qua opencode.

Dự án này được tạo bởi những người bảo trì của SST và mời gọi cộng đồng tham gia đóng góp để xây dựng một kho tàng kiến thức AI phong phú và hữu ích.

Chia sẻ:FacebookX
Nội dung tổng hợp bằng AI, mang tính tham khảo. Xem bài gốc ↗