Alibaba thừa nhận đang chật vật đuổi kịp đối thủ chip và AI, giới thiệu bộ tăng tốc Zhenwu M890
Gã khổng lồ công nghệ Trung Quốc Alibaba vừa ra mắt chip tăng tốc AI mới mang tên Zhenwu M890 cùng hệ thống máy chủ đi kèm, tuy nhiên họ cũng thừa nhận sản lượng sản xuất của mình còn quá thấp so với các đối thủ phương Tây như Nvidia. Thông số kỹ thuật của chip mới khá ấn tượng trên lý thuyết, nhưng việc thiếu hụt công nghệ sản xuất tiên tiến đang kìm hãm tham vọng của Alibaba trong mảng điện toán đám mây.

Alibaba thừa nhận đang chật vật đuổi kịp đối thủ chip và AI, giới thiệu bộ tăng tốc Zhenwu M890
Chip Alibaba T-Head M890 và máy chủ Panjiu AL128
Gã khổng lồ công nghệ Trung Quốc Alibaba vừa mới công bố một chip tăng tốc (accelerator) mới cùng hệ thống máy chủ quy mô rack đi kèm, nhưng đồng thời cũng thừa nhận một thực tế phũ phàng: họ chỉ có thể sản xuất chip với số lượng "đáng lẽ".
Con chip mới này có tên gọi là Zhenwu M890, được phát triển bởi mảng kinh doanh thiết kế bán dẫn T-Head của Alibaba. Cả hai công ty đều chưa cung cấp nhiều chi tiết về hiệu năng, ngoại trừ việc xác nhận chip sở hữu 144GB bộ nhớ trên chip, tốc độ băng thông liên chip đạt 800 GB/giây và hỗ trợ các định dạng độ chính xác gốc từ FP32 xuống đến FP4.
Dựa trên các thông số kỹ thuật của thiết bị cũ và mới, người ta dự đoán rằng M890 có thể sẽ cạnh tranh sòng phẳng với GPU Nvidia H200 ra mắt năm 2024 về mặt lý thuyết. Tuy nhiên, con số thú vị nhất trong thông báo của Alibaba lại là 560.000 — đây là tổng số chip Zhenwu mà Alibaba cho biết T-Head đã sản xuất tính đến thời điểm hiện tại.
Hệ thống máy chủ Panjiu AL128 Supernode
So sánh "kém một đầu" với các đối thủ lớn
Nếu so sánh với các đối thủ phương Tây, con số này có vẻ khiêm tốn. Nvidia từng khẳng định rằng chỉ riêng AWS sẽ triển khai tới một triệu GPU của họ trong năm nay. Chi tiêu cho cơ sở hạ tầng AI của AWS ở mức tương tự như Microsoft, Meta và Google, do đó hoàn toàn có khả năng Nvidia sẽ sản xuất và bán ba đến bốn triệu GPU chỉ để phục vụ bốn khách hàng lớn này.
Trong thông báo của mình, Alibaba không cung cấp thông tin cụ thể về sản lượng của M890. Thay vào đó, họ tập trung vào hệ thống máy chủ sẽ chạy chip này. Được đặt tên là Panjiu AL128 Supernode Server, Alibaba mô tả đây là "hệ thống quy mô rack đóng gói 128 bộ tăng tốc AI vào một đơn vị, cung cấp băng thông nội bộ ở mức petabyte mỗi giây... được thiết kế riêng cho các mô hình hành vi của AI Agent (tác nhân AI): các yêu cầu suy luận (inference) tần suất cao, khó dự đoán khiến các cụm máy tính truyền thống bị quá tải".
Rào cản từ lệnh trừng phạt và công nghệ sản xuất
Alibaba cũng đã tạo ra một chip mạng mới có tên "ICN Switch 1.0" với băng thông tổng thể lên tới 25,6 Tbps. Tuy nhiên, đây là những thông số kỹ thuật mà Broadcom và Nvidia đã đạt được từ nhiều năm trước.
Do đó, các con chip của Alibaba hiện mang lại hiệu năng khiến mảng đám mây của họ tụt hậu khá xa so với các đối thủ phương Tây. Điều này sẽ trở thành vấn đề lớn nếu các đối thủ Trung Quốc của họ vẫn được phép mua thiết bị từ Nvidia. Tuy nhiên, bất chấp việc Mỹ nới lỏng một số hạn chế xuất khẩu đối với phần cứng AI tiên tiến, Bắc Kinh vẫn chưa cho phép người mua trong nước tiếp cận các sản phẩm này. Nvidia gần đây cũng cho biết họ không mong đợi doanh thu từ thị trường Trung Quốc trong tương lai gần.
Các nhà cung cấp dịch vụ siêu lớn (hyperscalers) của Trung Quốc chưa công bố chi tiêu vốn (capex) ở mức gần ngang bằng với các đối thủ Mỹ. Có lẽ giờ đây chúng ta đã hiểu lý do: T-Head không thể sản xuất được nhiều thiết bị, chủ yếu là do các bộ tăng tốc như M890 yêu cầu quy trình sản xuất bán dẫn tiên tiến mà các công ty Trung Quốc không thể tiếp cận từ các nhà máy nước ngoài do lệnh trừng phạt của Mỹ. Các nhà máy sản xuất chip của Trung Quốc hiện vẫn chưa thể sánh ngang với sự hùng mạnh của TSMC — nguồn cung cấp cho hầu hết các GPU cao cấp hiện nay.
Những giải pháp thay thế
Vậy các gã khổng lồ công nghệ Trung Quốc đang đáp ứng nhu cầu như thế nào? Trước đây chúng tôi đã đưa tin về các nỗ lực buôn lậu linh kiện Nvidia vào Trung Quốc, và mới đây Bloomberg đưa tin chính quyền Đài Loan đã đàn áp các nhóm buôn lậu GPU. Chúng ta cũng thấy những đề xuất cho rằng các công ty Trung Quốc chuyển thiết bị lưu trữ qua biên giới để di chuyển dữ liệu sang các cơ sở có sẵn hệ thống Nvidia chờ xử lý khối lượng công việc đào tạo (training).
Cuộc đua công nghệ AI và chip tại Trung Quốc đang trở nên gay gắt hơn bao giờ hết, không chỉ về hiệu năng phần cứng mà còn là bài toán sản xuất trong bối cảnh địa chính trị phức tạp.



