DeepSeek ra mắt API v4: Tương thích hoàn toàn với OpenAI và khả năng suy luận tùy chỉnh

DeepSeek vừa công bố phiên bản API v4 với hai mô hình mới là Flash và Pro, mang lại khả năng suy luận nâng cao. Điểm nổi bật là sự tương thích hoàn toàn với SDK của OpenAI và Anthropic, giúp các nhà phát triển dễ dàng tích hợp mà không cần viết lại mã nguồn.

DeepSeek đã chính thức tung ra phiên bản API v4, đánh dấu bước tiến mới trong mảng trí tuệ nhân tạo tạo sinh (Generative AI) của hãng Trung Quốc. Bản cập nhật này không chỉ giới thiệu các mô hình ngôn ngữ mạnh mẽ hơn mà còn tập trung vào tính linh hoạt cho các nhà phát triển thông qua khả năng tương thích rộng rãi.

Các mô hình mới: Flash và Pro

Trong bản cập nhật này, DeepSeek giới thiệu hai biến thể mô hình chính: deepseek-v4-flash và deepseek-v4-pro. Mặc dù tài liệu chưa đi sâu vào thông số kỹ thuật chi tiết, nhưng dựa trên tên gọi, có thể suy đoán phiên bản Flash sẽ tập trung vào tốc độ xử lý nhanh, trong khi Pro hướng đến khả năng giải quyết vấn đề phức tạp hơn.

Đồng thời, DeepSeek cũng thông báo về lộ trình ngừng hỗ trợ (deprecation) đối với các tên gọi cũ là deepseek-chat và deepseek-reasoner vào ngày 24/07/2026. Tuy nhiên, để đảm bảo tính ổn định cho các hệ thống hiện tại, hai tên gọi cũ này vẫn có thể sử dụng và sẽ tương ứng lần lượt với chế độ không suy luận và chế độ suy luận của deepseek-v4-flash.

Tương thích dễ dàng với OpenAI và Anthropic

Một trong những điểm cộng lớn nhất của DeepSeek v4 là sự tương thích về định dạng API với các "ông lớn" như OpenAI và Anthropic. Điều này có nghĩa là các nhà phát triển đang sử dụng SDK của OpenAI hoặc phần mềm tương thích với API của OpenAI/Anthropic không cần phải viết lại mã nguồn phức tạp.

Chỉ cần thay đổi địa chỉ base_url thành https://api.deepseek.com (đối với OpenAI) hoặc https://api.deepseek.com/anthropic (đối với Anthropic) và sử dụng API key của DeepSeek, hệ thống có thể hoạt động ngay lập tức.

Tính năng Reasoning tùy chỉnh

Điểm mới lạ trong API v4 là sự xuất hiện của các tham số liên quan đến quá trình suy luận (reasoning). Cụ thể, người dùng có thể bật chế độ suy luận bằng tham số thinking với giá trị enabled.

Ngoài ra, tham số reasoning_effort cho phép điều chỉnh mức độ nỗ lực suy luận của mô hình, với các tùy chọn như "high" (cao). Điều này giúp người dùng cân bằng giữa độ chính xác của câu trả lời và chi phí tính toán hoặc thời gian phản hồi, tùy thuộc vào yêu cầu cụ thể của ứng dụng.

Ví dụ tích hợp

Dưới đây là đoạn mã mẫu bằng Python sử dụng thư viện OpenAI để kết nối với DeepSeek v4:

# Cài đặt thư viện: pip3 install openai
import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ.get('DEEPSEEK_API_KEY'),
    base_url="https://api.deepseek.com"
)

response = client.chat.completions.create(
    model="deepseek-v4-pro",
    messages=[
        {"role": "system", "content": "Bạn là một trợ lý hữu ích."},
        {"role": "user", "content": "Xin chào!"},
    ],
    stream=False,
    reasoning_effort="high",
    extra_body={"thinking": {"type": "enabled"}}
)

print(response.choices[0].message.content)

Với những cải tiến này, DeepSeek đang dần khẳng định vị thế là một lựa chọn thay thế khả thi và chi phí hiệu quả cho các nhà phát triển đang tìm kiếm sức mạnh AI mới mẻ.