Bí mật đằng sau nỗ lực của AWS nhằm biến mạng máy tính biến mất
Tại một phòng thí nghiệm ở Cupertino, các kỹ sư của Amazon Web Services đang âm thầm làm việc để biến mạng máy tính trở nên vô hình như một công tắc đèn. Chiến lược tự chủ phần cứng và phần mềm của họ giúp AWS xử lý băng thông khổng lồ và giảm độ trễ, đặc biệt trong kỷ nguyên AI tạo sinh.

Bí mật đằng sau nỗ lực của AWS nhằm biến mạng máy tính biến mất
Trong một tòa nhà văn phòng ba tầng bình thường tại Cupertino, California, các kỹ sư của Amazon Web Services (AWS) đang bận rộn với một sứ mệnh đặc biệt: làm cho mạng máy tính trở nên vô hình.
Matt Rehder và Satish Vangala tại phòng thí nghiệm mạng của AWS
The Register đã có cơ hội tham quan phòng thí nghiệm Torre Avenue của AWS vào cuối tháng 4 vừa qua. Tại đây, Matt Rehder, Phó chủ tịch mảng mạng lõi của AWS, đã chia sẻ triết lý của họ: "Mạng nên giống như một công tắc đèn. Nó là thứ chỉ cần hoạt động. Bạn chỉ quan tâm đến nó khi nó bị hỏng. Nếu không, bạn muốn nó không làm phiền bạn."
Tư duy "Mạng vô hình" và sự tự chủ
Trong 15 năm qua, mô hình tư duy của AWS luôn là làm thế nào để đưa mạng lưới ra khỏi đường chân trời của người dùng. Kể từ năm 2010, AWS nhận thấy rằng mô hình mạng truyền thống với các thiết bị tích hợp dọc sẽ kìm hãm sự đổi mới và giữ biên lợi nhuận cao cho các nhà sản xuất thiết bị mạng, giống như mô hình máy tính lớn (mainframe) cũ kỹ.
Thay vì dựa vào các nhà cung cấp bên thứ ba, AWS quyết định tự kiểm soát công nghệ mạng của mình. Họ bắt đầu phát triển phần cứng và phần mềm riêng, từ các bộ chuyển mạch (switch), bộ định tuyến (router) đến hệ điều hành.
Switch thế hệ mới của AWS với tốc độ 1.6Tb
Điểm độc đáo trong chiến lược của AWS là sự đơn giản hóa. Trong khi các nhà cung cấp mạng khác thường sử dụng các loại chip ASIC (mạch tích hợp ứng dụng cụ thể) khác nhau cho mạng lõi, mạng biên và mạng tổng hợp, AWS chỉ sử dụng một loại chip duy nhất cho tất cả.
"Chúng tôi sử dụng một loại chip cho mọi thứ," ông Rehder khẳng định. "Nếu bạn có một thứ và đầu tư mạnh vào việc làm cho nó thực sự tốt, bạn đang dồn toàn bộ năng lượng vào phần cứng và phần mềm đó để khiến nó siêu tin cậy. Điều này cũng giúp chúng tôi mở rộng quy mô mạng vì không phải cân đối hàng loạt mã hàng (SKU) cạnh tranh."
Hiện tại, bộ chuyển mạch do AWS tự chế có khả năng truyền tải 51,2 terabit mỗi giây thông qua 64 cổng hoạt động ở tốc độ 800 gigabit mỗi giây. Trong vòng 12 tháng tới, thế hệ tiếp theo sẽ đạt mức 102,4 terabit mỗi giây với các cổng 1,6 terabit mỗi giây.
Tất cả đều chạy trên một hệ điều hành duy nhất gọi là NetOS (một phiên bản của Linux). Việc sở hữu toàn bộ mã nguồn giúp AWS kiểm soát bảo mật tốt hơn, quét lỗi, vá lỗi và cập nhật thiết bị thường xuyên.
Đổi mới với sợi quang lõi rỗng
Hạ tầng mạng của AWS hiện bao gồm khoảng hai triệu thiết bị, 50-60 triệu liên kết quang và khoảng 20 triệu km cáp quang trên đất liền và dưới biển. Một trong những cải tiến đáng chú ý gần đây là việc triển khai sợi quang lõi rỗng (hollow core fiber).
Khác với cáp quang thông thường nơi tín hiệu đi qua thủy tinh, sợi quang lõi rỗng bao gồm một ống thủy tinh bao quanh không khí hoặc chân không. Điều này làm giảm nhiễu khúc xạ và cho phép ánh sáng di chuyển với tốc độ gần giới hạn tự nhiên của nó.
Kết quả là giảm 30% độ trễ, một con số đáng kể đối với việc đặt trung tâm dữ liệu. Nhờ công nghệ này, các trung tâm dữ liệu có thể được đặt xa nhau hơn trong cùng một khu vực (region) mà vẫn đảm bảo hiệu suất như ở cùng một địa điểm, giúp AWS linh hoạt hơn trong việc lựa chọn đất đai và nguồn điện.
Thách thức từ AI tạo sinh và độ tin cậy
Nhu cầu về băng thông đã tăng vọt trong vài năm gần đây nhờ sự bùng nổ của các dịch vụ AI tạo sinh. Các máy chủ tăng tốc hiện tại có nhu cầu băng thông gấp 3-4 lần so với máy chủ dựa trên CPU truyền thống.
Phòng thí nghiệm mạng của AWS tại Cupertino
Để đáp ứng điều này, AWS sử dụng kiến trúc UltraCluster, giảm số lượng thiết bị mạng trên đường đi giữa hai máy chủ từ bảy xuống năm, giúp mở rộng quy mô lớn hơn với độ trễ thấp hơn.
Tuy nhiên, vận hành ở quy mô lớn cũng đặt ra những thách thức về vật lý, đặc biệt là với cáp quang. Một hạt bụi nhỏ hoặc kết nối không hoàn hảo cũng có thể làm suy giảm tín hiệu. Để giải quyết vấn đề này, AWS sử dụng một thiết bị gọi là "firefly" (đom đóm) – một đầu nối có khả năng xác minh đường dẫn tín hiệu quang. Khi cáp được đưa vào trung tâm dữ liệu, thiết bị này sẽ gửi tín hiệu và kiểm tra xem nó có quay trở lại đúng hay không, đảm bảo đường dẫn sạch sẽ trước khi kết nối với khách hàng.
Khi mạng hoạt động trơn tru – điều xảy ra hơn 99% thời gian – người dùng thậm chí không nhận ra sự tồn tại của những kỹ thuật phức tạp này.
Bài viết liên quan

Công nghệ
Các ông lớn công nghệ ủng hộ dự luật đưa 'Kỹ năng AI' vào chương trình giáo dục phổ thông
04 tháng 5, 2026

Công nghệ
"Đừng đụng vào thương hiệu của tôi": Nhà sáng lập Notepad++ cảnh báo pháp lý với bản port macOS
04 tháng 5, 2026

Công nghệ
Sierra huy động 950 triệu USD, cuộc đua giành thị phần AI doanh nghiệp bước vào giai đoạn khốc liệt
04 tháng 5, 2026
