Broadcom mở rộng đế chế chip tùy chỉnh, bắt tay với startup AI FuriosaAI của Hàn Quốc

Broadcom đã chính thức thêm FuriosaAI vào danh sách đối tác phát triển bộ tăng tốc AI dựa trên công nghệ đóng gói chip tiên tiến của mình. Chip thế hệ thứ ba này sẽ được sản xuất trên quy trình 2nm, tích hợp bộ nhớ HBM4 và tận dụng công nghệ mạng của Broadcom để hỗ trợ các hệ thống quy mô lớn. Động thái này đánh dấu sự trỗi dậy mạnh mẽ của Broadcom trong thị trường phần cứng AI hiện nay.

Broadcom đã bổ sung FuriosaAI, một startup đến từ Hàn Quốc, vào danh sách các đối tác xây dựng bộ tăng tốc AI dựa trên nền tảng công nghệ đóng gói chip của mình. Sau nhiều năm hoạt động thầm lặng làm "chất kết dính" cho nhiều bộ vi xử lý hiện đại, Broadcom hiện đang nổi lên và tận dụng lợi ích từ bong bóng AI.

Sự hợp tác mới nhất này nhằm mục đích chuyển đổi công nghệ Bộ xử lý Co Tensor (Tensor Contraction Processor) của FuriosaAI thành một hệ thống đa nhân trên gói (multi-die system-on-package), được thiết kế cho các khối lượng công việc suy luận AI (AI inference) có quy mô lớn đang rất phổ biến hiện nay.

Chi tiết về chip thế hệ mới

Mặc dù chi tiết về con chip mới vẫn còn khá ít ỏi, FuriosaAI khẳng định rằng bộ xử lý này sẽ được sản xuất trên quy trình 2nm và sử dụng bộ nhớ HBM4 hoặc HBM4e "hai lớp" nhờ vào công nghệ đóng gói tiên tiến của Broadcom.

Chúng ta đã từng tìm hiểu về công nghệ Hệ thống Gói trong Kích thước Cực đoan (Extreme Dimension System in Package - 3.5D XDSiP) của Broadcom. Công nghệ này nhằm đơn giản hóa quá trình đưa các bộ tăng tốc đa nhân phức tạp (tương tự như dòng AMD MI300) ra thị trường. Về cơ bản, công nghệ này tách rời tính toán cốt lõi, bộ nhớ, I/O và logic cấp thấp thành các chiplet riêng biệt, sau đó lắp ráp chúng bằng các kỹ thuật đóng gói 3D như liên kết lai (hybrid bonding) thành một chip logic duy nhất.

Thay vì phải thiết kế một con chip hoàn chỉnh từ đầu, giải pháp này cho phép các nhà thiết kế chip tập trung vào các chức năng logic cốt lõi của bộ xử lý, từ đó giảm thiểu thời gian, vốn và rủi ro liên quan đến việc tung ra một sản phẩm mới.

Tận dụng công nghệ mạng của Broadcom

Bên cạnh công nghệ đóng gói tiên tiến, chip thế hệ thứ ba của FuriosaAI cũng sẽ sử dụng các sản phẩm Ethernet và PCIe của Broadcom để hỗ trợ các hệ thống vượt quá tám chip — giới hạn của dòng sản phẩm hiện tại.

Điều này ngụ ý việc sử dụng các switch Ethernet độ radix cao, như Tomahawk 6 (TH6) của Broadcom, cho các mạng mở rộng quy mô (scale out) hoặc mạng mở rộng mật độ (scale up). Trong khi các mạng scale up trước đây thường bị thống trị bởi các kết nối độc quyền như NVLink, Ethernet đang ngày càng trở thành một lựa chọn thay thế hấp dẫn. Thực tế, AMD đang truyền giao thức UALink — một đối thủ mới nổi của NVLink — qua Ethernet, với ít nhất một số triển khai của OEM sử dụng switch TH6 của Broadcom.

Hiệu suất và hiệu quả năng lượng

Sự hợp tác mới nhất của FuriosaAI diễn ra khoảng một năm sau khi startup này chính thức ra mắt các bộ tăng tốc thế hệ thứ hai mang tên RNGD (đọc là "renegade").

Các thẻ dựa trên PCIe này có thông số khiêm tốn hơn, mang lại hiệu suất gần với GPU workstation cao cấp hoặc chip trung tâm dữ liệu cũ hơn là một con chip AI hiện đại. Mỗi chip RNGD cung cấp tối đa 512 teraFLOPS tính toán FP8 dày đặc, 48 GB HBM3 trên hai chồng và băng thông bộ nhớ 1,5 TB/s. Để so sánh, Nvidia B200 cung cấp khoảng 9x FLOPS FP8, 4x dung lượng bộ nhớ và hơn 5x băng thông.

Tuy nhiên, hiệu suất của Nvidia đi kèm với mức tiêu thụ điện năng TDP lên tới 1.000 watt, trong khi FuriosaAI khẳng định RNGD chỉ tiêu thụ khoảng 180 watt. Mức tiêu thụ điện năng thấp hơn này có nghĩa là ngay cả khi sử dụng tám chip trong một nút duy nhất, hệ thống của FuriosaAI có thể dễ dàng được triển khai trong các trung tâm dữ liệu làm mát bằng khí truyền thống mà không cần sửa đổi giá đỡ (rack).

Mặc dù không mạnh mẽ bằng các chip mới nhất của Nvidia hay AMD, công nghệ của FuriosaAI đã thuyết phục được một số khách hàng quan trọng, bao gồm LG, hiện đang chạy dòng mô hình Exaone trên chip RNGD.

Broadcom thống trị mảng IP tùy chỉnh

FuriosaAI chỉ là nhà thiết kế chip mới nhất công bố mối quan hệ của mình với Broadcom. Đó là một "bí mật mở" rằng các công ty sở hữu trí tuệ (IP) như Broadcom và Marvell chịu trách nhiệm thiết kế các phần lớn của phần cứng AI tùy chỉnh được sử dụng trong các trung tâm dữ liệu của các siêu nhà cung cấp dịch vụ đám mây (hyperscalers).

Tuy nhiên, vai trò của Broadcom trong thành công của những con chip này trước đây được giữ bí mật khá kỹ lưỡng. Đầu năm nay, Meta là một trong những đơn vị đầu tiên phá vỡ sự im lặng, tiết lộ bốn bộ tăng tốc AI mới trong danh mục MTIA được thiết kế với sự trợ giúp của Broadcom.

Broadcom cũng đã chính thức công bố mối quan hệ với Google. Trong khuôn khổ sự hợp tác với Anthropic vào tháng 4, Google cho biết họ sẽ cung cấp cho nhà phát triển mô hình này công suất TPU gigawatt được đồng phát triển với Broadcom.

IP bộ tăng tốc tùy chỉnh đã trở thành một mảng kinh doanh lớn đối với Broadcom, chiếm 65% tổng doanh thu trong quý đầu năm 2026 của công ty.