Công nghệ mạng Omni-Path của Intel quay trở lại, thách thức InfiniBand trong siêu máy tính mới của Bộ Năng lượng Mỹ

16 tháng 6, 2026·5 phút đọc

Bộ Năng lượng Mỹ (DoE) đã kích hoạt hệ thống siêu máy tính mới tại Phòng thí nghiệm Quốc gia Lawrence Livermore, sử dụng công nghệ kết nối Omni-Path từ công ty con của Intel là Cornelis Networks. Hệ thống mang tên Lynx này đạt tốc độ 400 Gbps, cung cấp một giải pháp thay thế hiệu quả cho công nghệ InfiniBand thống trị của Nvidia. Đây được xem là bước tiến quan trọng khẳng định sự trở lại của công nghệ mạng hiệu suất cao này.

Công nghệ mạng Omni-Path của Intel quay trở lại, thách thức InfiniBand trong siêu máy tính mới của Bộ Năng lượng Mỹ

Trong lĩnh vực kết nối các siêu máy tính, công nghệ InfiniBand của Nvidia hiện đang thống trị thị trường, nhưng một đối thủ mới đang âm thầm gia nhập cuộc đua với giải pháp riêng của mình. Tuần này, Bộ Năng lượng Mỹ (DoE) đã正式启动 một cụm máy chủ mới tại Phòng thí nghiệm Quốc gia Lawrence Livermore, và linh kiện kết nối mọi thứ trong hệ thống này chính là công nghệ kết nối Omni-Path thuộc sở hữu của Cornelis Network – một công ty con tách ra từ Intel.

Hệ thống mang tên Lynx, dù được coi là khiêm tốn so với các siêu máy tính khác của DoE, vẫn sở hữu sức mạnh đáng kể với 952 nút máy chủ Dell Technologies PowerEdge sử dụng bộ vi xử lý Intel Xeon Scalable thế hệ 4 (codename Sapphire Rapids). Hệ thống này được ủy quyền bởi Cục An ninh Hạt nhân Quốc gia (NNSA) và sẽ cung cấp thêm sức mạnh tính toán cho các khối lượng công việc bí mật nhất của nước Mỹ.

Tuy nhiên, điểm khiến cỗ máy này trở nên khác biệt không nằm ở khả năng tính toán, mà nằm ở lựa chọn về công nghệ kết nối (interconnect). Hầu hết các hệ thống của DoE hiện nay đều sử dụng công nghệ Slingshot 11 độc quyền của HPE Cray hoặc mạng InfiniBand của Nvidia. Lynx không sử dụng cái nào trong hai lựa chọn trên, mà thay vào đó chọn các bộ chuyển mạch và card mạng (NIC) dòng CN5000 Omni-Path của Cornelis Network.

"Sự hợp tác giữa chương trình NNSA ASC và Cornelis bắt nguồn từ cam kết chung nhằm thúc đẩy điện toán hiệu suất cao (HPC). Lynx phản ánh kết quả của khoản đầu tư R&D công-tư này và sẽ hỗ trợ các khả năng mô hình hóa, mô phỏng và phân tích làm nền tảng cho tổ hợp NNSA hiện đại," Matt Leininger, chiến lược gia HPC cấp cao tại LLNL, cho biết trong một tuyên bố.

Nếu cái tên Omni-Path nghe có vẻ quen thuộc, đó là vì công nghệ này đã tồn tại dưới hình thức này hay hình thức khác trong gần một thập kỷ. Ban đầu được Intel phát triển vào năm 2015 cho các ứng dụng HPC, công nghệ kết nối không mất mát (lossless interconnect) này có nhiều điểm tương đồng với InfiniBand.

Một số Phòng thí nghiệm của DoE đã là những người áp dụng sớm, bao gồm siêu máy Trinity tại Phòng thí nghiệm Quốc gia Los Alamos và máy Cori, trước khi Intel ngừng hỗ trợ vào năm 2019. Bộ phận này cuối cùng đã được tách ra thành công ty riêng vào năm 2020.

Đối với nhiều người, câu chuyện kết thúc tại đó, nhưng vào năm 2025, công ty đã ra mắt dòng sản phẩm NIC và bộ chuyển mạch CN5000 cho toàn thế giới, hứa hẹn khả năng kết nối 400 Gbps với hiệu suất mở rộng gần như tuyến tính.

Công nghệ này nhanh chóng thu hút sự chú ý của DoE, và cơ quan này đã chọn công nghệ của startup mạng ngách này cho hệ thống Lynx vào mùa hè năm ngoái. Omni-Path không chỉ cung cấp cho cơ quan một giải pháp thay thế cho InfiniBand đối với các hệ thống không phải Cray, mà giờ đây còn là một trong những công nghệ kết nối nhanh nhất trong kho vũ khí của họ.

Đa số các hệ thống Cray được triển khai tại các phòng thí nghiệm của DoE hiện hoạt động ở tốc độ 200 Gbps. Về mặt kỹ thuật, InfiniBand có thể hỗ trợ tốc độ cổng cao hơn, nhưng đang ở trạng thái cầu vượt cao do nhu cầu khổng lồ từ các cụm máy tính AI.

Đối với Cornelis, việc triển khai này đại diện cho một điểm kiểm chứng quan trọng cho giao thức Omni-Path thế hệ tiếp theo và các hệ thống mạng của công ty.

"Nó đang đặt ra điểm kiểm chứng nền tảng để ngành công nghiệp thấy rằng những khách hàng khắt khe nhất đã chạy thử nghiệm nó và đang thấy kết quả thực sự tốt," CEO của Cornelis, Lisa Spelman, chia sẻ với The Register.

Đặc biệt, Spelman cho biết việc triển khai này đã cho phép Cornelis chứng minh hiệu quả mở rộng quy mô của danh mục sản phẩm CN5000.

Khi các cụm máy tính ngày càng mở rộng, kết nối mạng có thể nhanh chóng trở thành nút thắt cổ chai. "Chúng tôi đã có thể chứng minh hiệu quả mở rộng mạng là 91%, con số tuyệt vời đối với quy mô cụm này," bà nói.

Hiệu quả mở rộng này tốt đến mức Spelman kỳ vọng Lynx sẽ vượt trội hơn so với các cụm có quy mô tương tự sử dụng các bộ vi xử lý hiện đại hơn, đơn giản是因为 vì kết nối mạng hiệu quả hơn.

Lynx sẽ không phải là siêu máy tính cuối cùng sử dụng công nghệ Omni-Path. Công ty đang phát triển thêm các hệ thống khác, bao gồm một số hệ thống mà chúng tôi được biết sẽ sử dụng các bộ tăng tốc không truyền thống.

"Chúng tôi mong chờ cơ hội tiếp theo để chứng minh điều này ở quy mô 2.000, 5.000, 10.000 nút và tiếp tục tăng lên từ đó," Spelman nói.

Cornelis cũng đang nỗ lực đưa thiết bị 800 Gbps nhanh hơn ra thị trường vào cuối năm nay, đúng thời điểm với việc ra mắt các bộ vi xử lý tương thích PCIe Gen 6.0 từ Intel, AMD và các hãng khác.

Kết nối PCIe 5.0 về cơ bản giới hạn các NIC thông thường ở mức 400 Gbps. Nvidia và một số bên khác đã giải quyết vấn đề này bằng cách tích hợp các bộ chuyển mạch PCIe lớn vào NIC của họ, cung cấp thêm băng thông nhưng lại làm tăng chi phí và độ phức tạp mà Spelman cho rằng Cornelis muốn tránh.

Dòng CN6000 dự kiến ra mắt vào nửa sau năm nay và dự kiến sẽ mang lại hỗ trợ kết nối Ethernet, cho phép khả năng tương thích cao hơn với các mạng hiện có.

Chia sẻ:FacebookX
Nội dung tổng hợp bằng AI, mang tính tham khảo. Xem bài gốc ↗