Cơ quan an toàn giao thông Mỹ vô tình làm lộ âm thanh buồng lái qua hình ảnh spectrogram

Việc Cục An toàn Giao thông Vận tải Quốc gia Mỹ (NTSB) công bố hình ảnh spectrogram từ máy ghi âm buồng lái đã vô tình cho phép công chúng khôi phục lại âm thanh cuộc hội thoại của phi công. Sự cố này làm nổi bật khả năng của các kỹ thuật xử lý tín hiệu và trí tuệ nhân tạo trong việc tái tạo dữ liệu âm thanh từ hình ảnh trực quan.

Cục An toàn Giao thông Vận tải Quốc gia Mỹ (NTSB) - cơ quan chịu trách nhiệm điều tra các vụ tai nạn máy bay - có chính sách không công bố bản ghi âm từ buồng lái. Tuy nhiên, mới đây, cơ quan này đã vô tình phát tán dữ liệu nhạy cảm khi công bố một hình ảnh spectrogram (biểu đồ quang phổ) được trích xuất từ bản ghi âm.

Hình ảnh này ghi lại những lời nói cuối cùng của hai phi công hãng UPS trước khi máy bay của họ gặp nạn tại Louisville, Kentucky vào năm ngoái. Scott Manley, một nhà khoa học và nhà phát triển phần mềm, đã từng cảnh báo cơ quan này về rủi ro của việc công khai loại dữ liệu này.

Từ hình ảnh đến âm thanh

"NTSB không phát hành bản ghi âm buồng lái từ các vụ tai nạn, ngoại trừ trong trường hợp này họ đã phát hành một hình ảnh của spectrogram," Manley viết trong một bài đăng trên mạng xã hội vào ngày 20/5/2026. "Tôi không chắc đó là một ý tưởng hay vì bạn có thể khôi phục lại một lượng lớn âm thanh từ hàng megabyte dữ liệu được mã hóa trong hình ảnh này."

Ngay sau đó, những người am hiểu công nghệ đã nhanh chóng chuyển đổi biểu đồ sóng âm đó trở lại thành file âm thanh và đăng tải lên mạng internet. Điều này buộc NTSB phải thừa nhận rằng họ hiện đã nhận ra sự tiến bộ trong công nghệ xử lý hình ảnh và tính toán cho phép chuyển đổi các biểu đồ thành âm thanh gần giống với bản gốc.

Công nghệ "mới nổi" thực ra đã tồn tại từ lâu

Trong một bài đăng trên mạng xã hội X, Jennifer Homendy, Chủ tịch NTSB, bày tỏ sự lo ngại sâu sắc: "Đáng lo ngại là công nghệ mới nổi có thể được sử dụng để trích xuất âm thanh từ máy ghi âm buồng lái (CVR) dựa trên dữ liệu trực quan mà chúng tôi chia sẻ để giúp công chúng hiểu rõ hoàn cảnh của một vụ tai nạn."

Tuy nhiên, thuật ngữ "mới nổi" ở đây thực ra ám chỉ những công nghệ đã tồn tại ít nhất 42 năm. Các kỹ thuật liên quan đến phổ độ lớn đã được thảo luận trong một bài báo nghiên cứu năm 1984 mang tên "Signal estimation from modified short-time Fourier transform" (Ước lượng tín hiệu từ biến đổi Fourier ngắn thời gian sửa đổi) của Daniel W. Griffin và Jae S. Lim. Công trình của họ dựa trên thuật toán xử lý tín hiệu lâu đời là Biến đổi Fourier nhanh (FFT).

Sự khác biệt chính hiện nay là sự sẵn có của các mô hình học máy (machine learning) đã hạ thấp đáng kể các rào cản kỹ thuật đối với việc chuyển đổi tín hiệu này, giúp bất kỳ ai có kỹ năng công nghệ cơ bản cũng có thể thực hiện việc tái tạo âm thanh.

Hậu quả và biện pháp khắc phục

Luật liên bang Mỹ cấm việc công bố thông tin này do tính chất nhạy cảm cao của các cuộc giao tiếp bên trong buồng lái. NTSB khẳng định họ coi trọng các hạn chế về quyền riêng tư này nhằm bảo vệ tính toàn vẹn của cuộc điều tra và thể hiện sự tôn trọng đối với nạn nhân và gia đình họ.

Vụ tai nạn của chuyến hàng hóa MD-11F (chuyến bay 2976) xảy ra vào ngày 4/11/2025, ngay sau khi cất cánh từ Sân bay Quốc tế Louisville Muhammad Ali. Tai nạn đã làm thiệt mạng 3 thành viên phi hành đoàn và 12 người trên mặt đất, cùng 23 người khác bị thương.

Hiện tại, NTSB đang thực hiện các bước để giải quyết vấn đề này. Hồ sơ công khai đã được đưa ngoại tuyến và cơ quan này đang kêu gọi X, Reddit và các nền tảng khác gỡ bỏ những bài đăng "ghê rợn" và đã bị thao túng này. Tuy nhiên, tại thời điểm bài viết này được thực hiện, các bản âm thanh được tái tạo từ lời nói cuối cùng của các phi công vẫn còn khả dụng trên mạng xã hội X.

Cơ quan an toàn giao thông Mỹ vô tình làm lộ âm thanh buồng lái qua hình ảnh spectrogram

Từ hình ảnh đến âm thanh

Công nghệ "mới nổi" thực ra đã tồn tại từ lâu

Hậu quả và biện pháp khắc phục

Bài viết liên quan