Khi nén dữ liệu đi quá xa: Từ MP3, JPG đến lỗi máy quét Xerox

20 tháng 4, 2026·3 phút đọc

Bài viết khám phá vai trò của nén dữ liệu trong kỷ nguyên số, giải thích cơ chế hoạt động của các định dạng phổ biến như MP3, JPG và MPG dựa trên sự hạn chế của giác quan con người. Tuy nhiên, nó cũng cảnh báo về những rủi ro tiềm ẩn của thuật toán nén kém, điển hình là sự cố máy quét Xerox đã tự động thay đổi số liệu trên bản vẽ kỹ thuật.

Khi nén dữ liệu đi quá xa: Từ MP3, JPG đến lỗi máy quét Xerox

Kỷ nguyên thông tin được định hình bởi băng thông. Internet bị giới hạn bởi lượng dữ liệu chúng ta có thể nén vào các đường truyền hẹp của cơ sở hạ tầng. Vì vậy, con người đã phát minh ra các kỹ thuật nén, những cách thức để biểu diễn cùng một đối tượng — một trang web, một bức ảnh, một bài hát hay một bộ phim — trong dung lượng số ngày càng nhỏ hơn. YouTube, Spotify, Instagram và các thuật toán vận hành chúng sẽ không thể tồn tại nếu thiếu đi công nghệ này.

Từ những nghiên cứu đầu tiên về nén dữ liệu (tại Phòng thí nghiệm Bell vào những năm 1940), các nhà nghiên cứu đã biết họ phải chấp nhận một sự đánh đổi: bạn có thể đạt được kích thước tệp nhỏ hơn nếu chấp nhận mất mát một phần dữ liệu gốc. Điều này có vẻ phản tác dụng, vì mục đích chính là tái tạo dữ liệu, nhưng các nhà khoa học đã tìm ra cách chỉ loại bỏ những thông tin mà con người khó nhận biết được.

Tận dụng "điểm mù" của giác quan

Tai và não bộ của chúng ta có xu hướng "lọc bỏ" những âm thanh nhỏ bị che khuất bởi những âm thanh lớn hơn. Định dạng MP3 tận dụng điểm mù này bằng cách cắt bỏ những phần âm thanh nhỏ mà chúng ta có khả năng lớn là không nghe thấy anyway.

Tương tự, mắt và não bộ tập trung vào độ tương phản giữa các hình dạng sáng và tối, đọc cấu trúc tổng thể của hình ảnh thay vì các chi tiết nhỏ hay sự thay đổi màu sắc tinh vi. Thuật toán JPG nén tệp bằng cách loại bỏ những thông tin mà chúng ta thường không xử lý.

Đối với phim ảnh, hình ảnh thực sự không thay đổi quá nhiều giữa các khung hình liên tiếp. Thuật toán MPG chọn kỹ lưỡng các khung hình chính (key frames) và lưu chuyển động tương đối của mỗi điểm ảnh, giúp làm giảm đáng kể dung lượng tệp phim.

Một thuật toán nén được thiết kế tốt sẽ giữ cho dữ liệu giống hệt về mặt cảm nhận trong khi làm cho việc lưu trữ và truyền tải tệp hiệu quả hơn nhiều.

Khi thuật toán nén gây ra thảm họa

Tuy nhiên, một codec được thiết kế kém có thể dẫn đến những sai lầm thảm khốc. Vào năm 2013, David Kriesel đã quét bản vẽ mặt bằng của một tòa nhà trên máy quét Xerox WorkCentre và nhận thấy rằng một căn phòng được ghi là 21,11m² đã trở thành 14,13m².

Việc triển khai định dạng nén JBIG2 của Xerox giúp tiết kiệm không gian bằng cách "ghép" các bản quét từ các yếu tố chung, lặp lại; trong bản quét của Kriesel, nó đã âm thầm thay thế các con số gốc bằng các con số từ một phần khác của tài liệu mà nó cho là đủ giống nhau về mặt thị giác. Sau khi Kriesel công bố, các báo cáo đã xuất hiện về việc thay thế âm thầm này ảnh hưởng đến các bản vẽ xây dựng, hóa đơn và hồ sơ y tế.

Sự suy giảm chất lượng theo thời gian

Nén dữ liệu luôn thay đổi dữ liệu một cách vĩnh viễn. Các định dạng phổ biến (JPG, MP3, MP4) thay đổi dữ liệu một cách từ từ và nhẹ nhàng: thường phải mất hàng trăm chu kỳ lưu, chia sẻ và tải lên lại thì các dấu hiệu công cụ, được gọi là hiện tượng tạo hình nén (compression artifacts), mới trở nên rõ ràng.

Lưu lại một tệp JPG đủ nhiều lần và nó sẽ bị vỡ hình, nhạt màu; lặp lại một tệp MP3 và các tông kim loại sẽ len lỏi vào âm nhạc; tải lại một video trên YouTube một nghìn lần và bạn sẽ kết thúc với một mớ hỗn độn không thể nhận biết được âm thanh.

Bài viết được tổng hợp và biên soạn bằng AI từ các nguồn tin tức công nghệ. Nội dung mang tính tham khảo. Xem bài gốc ↗