Hành trình 11 năm cứu vớt và số hóa 13.000 tài liệu kỹ thuật lịch sử
Sau hơn một thập kỷ nỗ lực, Jason Scott đã hoàn thành việc số hóa và công bố bộ sưu tập 13.000 tài liệu hướng dẫn lên Internet Archive. Dự án không chỉ lưu giữ kiến thức kỹ thuật mà còn bảo tồn một phần quan trọng của lịch sử công nghệ và thiết kế.

Hơn một thập kỷ trước, tôi nhận được thông báo về một kho khổng lồ chứa hàng ngàn cuốn sổ tay hướng dẫn (manuals) sắp bị vứt bỏ. Với đầy nhiệt huyết, tôi đã lái xe đến đó, thương thảo với chủ sở hữu, và sau một chuỗi ngày dài huy động hàng chục người cùng hàng chục ngàn đô la, chúng tôi đã cứu được bộ sưu tập này khỏi bãi rác. Bước tiếp theo tất nhiên là số hóa chúng tất cả. Nhưng quá trình đó đã mất nhiều thời gian hơn tôi tưởng tượng.
Kho chứa tài liệu khổng lồ cần được giải cứu
Vừa qua, bộ sưu tập gồm 13.000 tài liệu đã chính thức được đưa lên Internet Archive. Về cơ bản, đây là tất cả các tài liệu có thể số hóa được từ đợt giải cứu đó. Vòng tròn nay đã khép kín: Được cứu -> Được lưu trữ -> Được di chuyển -> Và giờ đây trực tuyến cho bất kỳ ai đọc được.
Một dự án đòi hỏi sự kiên trì
Nếu bạn không muốn đọc hết hàng chục bài viết dài dòng về quá trình này, tôi có thể tóm tắt lại như sau: Được thông báo về kho hàng sắp bị hủy -> Thương lượng giữ lại một tuần -> Huy động người và tiền để đóng gói, di chuyển và lưu trữ -> Chuyển từ kho này sang địa điểm khác (một quán cà phê đóng cửa trong trung tâm thương mại) -> Chuyển toàn bộ đến California -> Tình nguyện viên phân loại -> Kết quả là hàng chục pallet -> Quyết định những gì nên quét và những gì không -> Hoàn tất.
Toàn bộ quá trình chỉ mất 11 năm và một cơn đau tim nhỏ.
Tại sao có tài liệu chưa được số hóa?
Có thể bạn sẽ hỏi: Tại sao vẫn còn tài liệu chưa được quét? Đây là một câu chuyện thú vị. Hai công ty vẫn coi các tài liệu này là sản phẩm và một phần của dòng sản phẩm hiện tại của họ. Nếu họ công khai, các bản quét của họ sẽ chất lượng và kỹ lưỡng hơn nhiều so với đống tài liệu trong bộ sưu tập này. Những công ty đó là HP (hiện là Agilent Technologies và Keysight) và Tektronix.
Do đó, việc quét các pallet này là vô nghĩa. Chúng tôi vẫn giữ nguyên vật lý của chúng, và nếu thực sự cần thiết, chúng có thể được tìm thấy, nhưng chi phí để quét dự phòng sẽ làm tăng gấp đôi ngân sách dự án.
Vấn đề tài chính và sự hỗ trợ từ DLARC
Tiền bạc thực sự là lý do khiến mọi thứ mất nhiều thời gian đến vậy. Quét hàng ngàn tài liệu, trong đó có những cuốn dày hàng trăm trang, là một dự án đắt đỏ trừ khi bạn nghĩ rằng mình có thể làm điều đó vào cuối tuần với một chiếc máy quét Epson cá nhân (thực tế là bạn không thể).
Mặc dù việc kêu gọi quyên góp từ cộng đồng đã mang lại hàng ngàn đô la, nhưng sự thúc đẩy lớn nhất đến từ Thư viện Kỹ thuật số Truyền thông Vô tuyến Nghiệp dư (Digital Library of Amateur Radio Communications - DLARC). Đây là một nhóm được tài trợ với sứ mệnh thu thập lịch sử vô tuyến nghiệp dư. Một tỷ lệ đáng kể các tài liệu là về vô tuyến, và DLARC đã chi trả cho việc quét tổng quát, giúp dự án cán đích thành công. Cảm ơn DLARC rất nhiều.
Giao diện bộ sưu tập trên Internet Archive
Giá trị của những đống giấy cũ
Toàn bộ dự án chắc chắn là một thành công, nhưng trên thang đo thời gian và công sức của con người, nó vô cùng khó khăn. Đó là rất nhiều việc bê vác, lái xe, tiền bạc và những khía cạnh cảm xúc vượt xa mong đợi đối với những đống giấy.
Nhưng tất nhiên, chúng không chỉ là giấy. Chúng là toàn bộ quan điểm về cách công nghệ vận hành, cách hướng dẫn người dùng tự bảo trì và chăm sóc thiết bị. Chúng là bằng chứng và cũng là sự tôn vinh đối với điều kỳ diệu của kỹ thuật. Chúng có giá trị trên nhiều cấp độ đối với không gian công nghệ hiện đại, và riêng về thiết kế đồ họa và typography cũng đã đủ để tiêu tốn cả một mùa hè để nghiên cứu.
Rào cản lớn nhất không phải là ý chí hay công sức, mà là tiền và tài trợ. Việc quét hàng trăm ngàn trang theo một phương pháp có trật tự, được theo dõi và đảm bảo chất lượng đòi hỏi nguồn vốn. Nếu tiền bạc không phải là vấn đề, toàn bộ việc này đã hoàn thành trong vài tháng.
Tiếp theo là gì?
Các tài liệu này hiện có siêu dữ liệu cơ bản. Nếu mọi người thấy một tài liệu cần mô tả chi tiết hơn, hoặc muốn ghi chú các mục sai sót, hãy để lại nhận xét dưới mục đó và tôi sẽ cập nhật. Bạn luôn có thể thực hiện tìm kiếm văn bản đầy đủ trên toàn bộ bộ sưu tập.
Tôi cũng muốn gửi lời cảm ơn đến những nỗ lực anh hùng của Dự án Bitsavers, một nỗ lực hoàn toàn độc lập trong việc quét tài liệu và hiện vật kỹ thuật số. Họ đã làm được nhiều hơn thế, trong thời gian dài hơn và liên tục hơn.
Bạn có làm lại tất cả những điều này không? Giống như những sự kiện Defenestrations của Prague, tôi sẽ làm lại, ngay cả khi nó mất trăm năm.
Bài viết liên quan

Công nghệ
Cerebras, đối tác thân thiết của OpenAI, sẵn sàng cho đợt IPO kỷ lục định giá tới 26,6 tỷ USD
04 tháng 5, 2026

Công nghệ
Microsoft giới thiệu Surface Pro 12 và Surface Laptop 8: Sức mạnh chip Intel, giá thành gây sốc
19 tháng 5, 2026
Công nghệ
Trang web ngăn chặn tự tử tại Hà Lan bị phát hiện chia sẻ dữ liệu người dùng cho các công ty công nghệ
13 tháng 5, 2026
