Voice Modem: Di sản của Hayes Smartmodem và kiến trúc âm thanh trong smartphone hiện đại
Bài viết đi sâu vào lịch sử và kỹ thuật của voice modem, từ giao thức AT kinh điển cho đến các chip Rockwell thập niên 90. Khám phá cách kiến trúc xử lý âm thanh độc lập này đã từng thống trị hệ thống IVR và vẫn còn tồn tại ngầm trong các modem di động 5G ngày nay.

Nếu bạn từng tìm hiểu kỹ về điện thoại di động hiện đại, bạn sẽ nhận thấy kiến trúc âm thanh, đặc biệt là âm thanh cuộc gọi, khá kỳ lạ. Trong các điện thoại cũ, modem di động thường có đường dẫn âm thanh tương tự trực tiếp đến mic và loa, hoạt động như một thiết bị "điện thoại" hoàn toàn độc lập. Vai trò của hệ điều hành chỉ là gửi lệnh bắt đầu và kết thúc cuộc gọi.
Ngày nay, dù đường dẫn âm thanh đã trở nên kỹ thuật số hơn, nhưng modem di động vẫn giữ vai trò là một thiết bị độc lập xử lý cuộc gọi. Điều này thực ra là di sản của một quyết định kiến trúc từ thời kỳ đầu của máy tính cá nhân, bắt nguồn từ Hayes Smartmodem và sự phát triển của các voice modem (modem thoại) vào thập niên 90.
Di sản của Hayes Smartmodem
Vào năm 1981, Hayes đã giới thiệu Smartmodem, một thiết bị cách mạng khi có thể tự động nhấc máy và quay số thông qua các lệnh điều khiển từ máy tính. Trước đó, các modem chỉ là thiết bị trong suốt yêu cầu người dùng thực hiện thao tác quay số thủ công.
Hayes đã tạo ra một giao thức điều khiển đơn giản mà chúng ta vẫn biết đến ngày nay: giao thức AT. Hầu hết các modem kết nối với máy tính, từ những chiếc cổng RS-232 cổ kính đến các modem 5G hiện đại nhất, vẫn sử dụng các biến thể của lệnh AT để cấu hình cơ bản. Khi bạn cắm một modem 5G vào máy Linux, nó sẽ xuất hiện dưới dạng một thiết bị USB composite với nhiều bộ chuyển đổi nối tiếp (serial adapters), giao tiếp với nhân hệ điều hành thông qua các kênh serial này.
Sự trỗi dậy của Voice Modem
Hầu hết các modem vào thập niên 80 chỉ dành cho dữ liệu (data) và fax. Tuy nhiên, vào đầu thập niên 90, các nhà sản xuất bắt đầu hỏi: Tại sao không thể sử dụng modem để thực hiện cuộc gọi thoại?
Rockwell International, một gã khổng lồ bán dẫn thời bấy giờ, là người tiên phong trong lĩnh vực này. Khoảng năm 1992, Rockwell đã giới thiệu các chip modem hỗ trợ thoại, dẫn đến làn sóng sản phẩm "data/fax/voice" (dữ liệu/fax/thoại). Để kích hoạt chế độ này, người dùng thường gửi lệnh AT#CLS=8 (Fax Class 8).
Về mặt kỹ thuật, voice modem hoạt động khá thú vị. Thay vì có kết nối âm thanh vật lý trực tiếp với máy tính, các voice modem đời đầu gửi dữ liệu âm thanh (thường là PCM 8-bit hoặc ADPCM) ngay qua chính kết nối serial đang dùng để truyền dữ liệu. Điều này tạo ra một thách thức lớn về băng thông và yêu cầu tốc độ truyền nối tiếp cao (115200 baud).
Ứng dụng thực tế và Thời kỳ Windows 95
Voice modem đã tạo ra một ngành công nghiệp nhỏ nhưng sôi động cho các hệ thống IVR (Phản hồi giọng nói tương tác) dựa trên PC dành cho văn phòng nhỏ. Thay vì mua hệ thống điện thoại đắt tiền, một doanh nghiệp nhỏ có thể sử dụng PC và modem thoại để làm thư ký tự động, hộp thư thoại và cây menu điện thoại.
Vào năm 1996, Microsoft đã thúc đẩy xu hướng này bằng cách giới thiệu Voice Modem Extensions cho Windows 95, mở rộng Telephony API (TAPI) để hỗ trợ voice modem một cách chuẩn hóa. Tuy nhiên, do sự thiếu đồng nhất trong cách các nhà sản xuất xử lý âm thanh (một số dùng serial, một số tích hợp với sound card), việc hỗ trợ phần mềm trở nên phức tạp.
Các sản phẩm như Creative Modem Blaster hay Phone Blaster là ví dụ điển hình. Chúng là sự kết hợp kỳ lạ giữa modem và sound card, cho phép máy tính đóng vai trò là máy trả lời tự động (answering machine).
Sự suy tàn và Sự tồn tại bền bỉ
Mặc dù đầy hứa hẹn, voice modem không bao giờ thực sự bùng nổ trong thị trường tiêu dùng. Máy tính thời đó quá ồn, đắt tiền và không ổn định để hoạt động 24/7 như một máy trả lời điện thoại. Hơn nữa, sự ra đời của DSL và VoIP vào cuối thập niên 90 đã giải quyết vấn đề truyền dữ liệu và thoại đồng thời tốt hơn nhiều so với bất kỳ nỗ lực nào của modem analog.
Tuy nhiên, công nghệ này không hề biến mất. Nó vẫn tồn tại trong các ứng dụng kinh doanh và đặc biệt là trong các modem di động hiện đại.
Kết nối với Smartphone hiện đại
Nếu bạn tháo rời một smartphone hiện đại, bạn sẽ thấy một thành phần gọi là "cellular modem" hay baseband. Đây là một thiết bị độc lập với bộ xử lý chính (CPU), chịu trách nhiệm xử lý sóng vô tuyến và cuộc gọi.
Một bài viết blog năm 2017 đã phàn nàn về việc các modem USB gắn ngoài không xuất hiện như thiết bị âm thanh USB chuẩn, mà thay vào đó truyền mẫu âm thanh PCM qua một trong các cổng UART. Tác giả gọi đây là một "cách giải quyết xấu xí" (ugly hack).
Nhưng nhìn lại lịch sử, ta nhận ra rằng đây không phải là một "hack", mà chính là cách thức hoạt động truyền thống. Từ năm 1981 với Hayes Smartmodem, đến năm 1992 với Rockwell voice modem, và bây giờ với modem 5G, nguyên tắc vẫn không đổi: Modem là một hộp đen xử lý điện thoại, và máy tính chỉ giao tiếp với nó qua các lệnh AT và dòng dữ liệu serial.
Kiến trúc âm thanh kỳ lạ trong điện thoại của bạn ngày nay thực chất là tiếng vọng của quá khứ, khi một chiếc modem phải tự mình "biết nói" qua đường dây điện thoại.
Bài viết liên quan

Công nghệ
Notepad++ chính thức có bản native cho macOS: Không cần giả lập, hỗ trợ chip Apple Silicon
27 tháng 4, 2026

Công nghệ
Sách "FreeBSD Device Drivers": Hướng dẫn toàn diện từ cơ bản đến làm chủ lập trình nhân
26 tháng 4, 2026

Công nghệ
Khám phá lại lịch sử Unix qua áp phích "Unix Magic" được chú giải chi tiết
27 tháng 4, 2026
