Chuyển Đổi 20 Năm Video và Ảnh Gia Đình Thành Dữ Liệu Số với Immich và AI
Bài viết chia sẻ kinh nghiệm số hóa hơn 20 năm video MiniDV, băng VHS cùng kho ảnh giấy thành thư viện kỹ thuật số tập trung trên hệ thống Immich chạy trên NAS Synology. Quy trình sử dụng công cụ AI để tự động nhận diện cảnh quay, gán metadata chi tiết giúp tìm kiếm và sắp xếp dễ dàng.

Chuyển Đổi 20 Năm Video và Ảnh Gia Đình Thành Dữ Liệu Số với Immich và AI
Lưu trữ hơn 20 năm ký ức gia đình trên các băng MiniDV, băng VHS và ảnh giấy tiềm ẩn nguy cơ mất mát do hư hỏng phần cứng. Bài viết này chia sẻ cách tác giả số hóa kho dữ liệu cũ kỹ, gom tất cả về một nơi là hệ thống Immich – giải pháp lưu trữ và quản lý ảnh/video tự chủ thay thế Google Photos, chạy trên NAS Synology.
Đặc biệt, quy trình số hóa này tích hợp công nghệ AI của Anthropic Claude để tự động nhận diện và mô tả cảnh quay, giúp đặt tên và gán metadata chính xác cho từng clip, phục vụ việc tìm kiếm và phân loại nhanh chóng trong thư viện số.
Hệ Thống và Phần Cứng Sử Dụng
- NAS: Synology hai khay ổ cứng, cấu hình RAID mirror với 6TB dung lượng hiệu dụng, RAM nâng lên 16GB để đủ sức xử lý các tác vụ AI và tạo ảnh thu nhỏ từ Immich chạy trong Docker.
- Thiết bị thu: Máy quay Sony DCR-PC100 (MiniDV qua FireWire), đầu phát VCR, thiết bị chuyển đổi video analog sang USB ClearClick Video2USB (cho băng VHS), máy quét ảnh Epson FastFoto FF-680W.
- Phần mềm xử lý: MacBook với các công cụ như ffmpeg, exiftool và Python 3.
- AI: API Claude của Anthropic hỗ trợ mô tả cảnh quay tự động.
Để tránh mất mát dữ liệu, tác giả còn sử dụng Synology Hyper Backup sao lưu toàn bộ vào AWS S3 Glacier Deep Archive với chi phí lưu trữ thấp, ưu tiên độ bền dữ liệu hơn tốc độ truy xuất.
Số Hóa Video MiniDV – Giải Pháp Kỹ Thuật
Thu Thập dữ liệu
Do máy Mac hiện đại không còn cổng FireWire, tác giả kết nối máy quay Sony với Mac qua ba bộ chuyển đổi nối chuỗi (FireWire 9-pin > 4-pin, FireWire sang Thunderbolt 2, Thunderbolt 3 sang Thunderbolt 2) để ghi video gốc chất lượng không mất mát.
Video được ghi bằng OBS Studio ra file MOV, tạo thuận tiện cho bước xử lý sau.
Xử lý cảnh quay bằng Python và AI
File gốc dài 60 phút phải được tách thành nhiều cảnh nhỏ dựa trên:
- Phát hiện điểm chuyển cảnh (scene change) dùng thư viện PySceneDetect với bộ lọc ContentDetector tùy chỉnh độ nhạy cho phù hợp.
- Lấy ảnh đại diện 1 frame mỗi cảnh gửi lên API Claude để AI tự động đưa ra tên file và mô tả đoạn video.
- Ghi metadata mô tả và ngày tháng chuẩn lên từng file clip bằng exiftool để Immich đọc đúng.
- Cắt bỏ đoạn cuối không có nội dung (deadspace) nhờ phân tích độ biến đổi ảnh bằng OpenCV.
Mỗi băng MiniDV sau xử lý được chia thành 20-40 đoạn clip nhỏ, dễ quản lý và tìm kiếm. Chi phí gọi API AI trong phạm vi vài chục cent/tape là hợp lý.
VHS và Ảnh Giấy
Số hóa băng VHS dùng máy VCR cũ kèm thiết bị chuyển đổi Video2USB, luồng xử lý y hệt MiniDV. Ảnh giấy được thuê máy quét Epson FF-680W để scan hàng loạt, đồng thời sử dụng script Python để gán nhãn ngày tháng dựa trên folder chứa.
Tối Ưu Quản Lý Thư Viện Immich
- Tận dụng tính năng thư viện ngoài (external libraries) của Immich để chỉ index file, giữ cấu trúc thư mục theo ý muốn mà không cần di chuyển dữ liệu.
- Vấn đề: external libraries không tự động tạo album ảnh, trong khi chia sẻ phải dựa trên album. Script
immich_album_from_library.pygiúp tạo album từ thư mục theo API Immich. - Đồng bộ ảnh iPhone từ Apple Photos sang NAS bằng rsync theo lịch trình tự động trên macOS, từ đó Immich chỉ việc index.
Bài Học và Lời Khuyên
- Metadata là chìa khóa: Ngày tháng, mô tả chính xác giúp thư viện hữu dụng; sửa sau rất mất công.
- Immich ưu tiên các trường metadata EXIF cụ thể: dùng exiftool thay vì ffmpeg để ghi.
- Chỉnh sửa metadata qua UI cho external library dễ bị ghi đè khi scan lại: luôn đặt metadata chuẩn từ file gốc.
- AI mô tả cảnh quay rất đáng đầu tư: giúp tìm kiếm chính xác theo nội dung như “bữa tiệc sinh nhật”, “hoàng hôn bãi biển” trên kho dữ liệu lớn.
- Ghi file tạm ở local rồi mới chuyển sang NAS giúp tránh lỗi và chậm khi ghi nhỏ lẻ qua SMB.
Kết Luận
Nếu bạn đang giữ các dữ liệu số hóa cũ hoặc ảnh giấy quý giá trong kho, hãy cân nhắc số hóa và lưu trữ theo hướng tiếp cận của Immich kết hợp AI. Nó vừa giúp bảo vệ kỷ niệm, vừa mang lại trải nghiệm quản lý, tìm kiếm hiện đại và tiện lợi.
Bạn có thể tham khảo toàn bộ script mà tác giả đã mở mã nguồn tại github.com/maxwheeler/immich-tools để bắt đầu tự chủ động số hóa dữ liệu gia đình mình ngay hôm nay.
Bài viết liên quan

Phần mềm
Anthropic ra mắt Claude Opus 4.7: Nâng cấp mạnh mẽ cho lập trình nhưng vẫn thua Mythos Preview
16 tháng 4, 2026

Công nghệ
Qwen3.6-35B-A3B: Quyền năng Lập trình Agentic, Nay Đã Mở Cửa Cho Tất Cả
16 tháng 4, 2026

Công nghệ
Spotify thắng kiện 322 triệu USD từ nhóm pirate Anna's Archive nhưng đối mặt với bài toán thu hồi
16 tháng 4, 2026
