Bên trong Spotify Wrapped 2025: Cách AI tạo ra câu chuyện cho hàng trăm triệu người dùng và đánh đổi quyền riêng tư

08 tháng 4, 2026·4 phút đọc

Đội ngũ kỹ thuật của Spotify đã xây dựng hệ thống tạo ra 1,4 tỷ báo cáo cá nhân hóa cho 350 triệu người dùng trong Wrapped 2025. Bằng cách kết hợp các thuật toán heuristic và mô hình ngôn ngữ AI, Spotify chuyển đổi dữ liệu thô thành những câu chuyện cảm xúc, song song với những lo ngại ngày càng tăng về quyền riêng tư và theo dõi dữ liệu.

Bên trong Spotify Wrapped 2025: Cách AI tạo ra câu chuyện cho hàng trăm triệu người dùng và đánh đổi quyền riêng tư

Bên trong Spotify Wrapped 2025: Cách AI tạo ra câu chuyện cho hàng trăm triệu người dùng và đánh đổi quyền riêng tư

Đội ngũ kỹ thuật của Spotify đã tiết lộ chi tiết về quy trình "Wrapped Archive" năm 2025, nơi họ tạo trước khoảng 1,4 tỷ báo cáo cá nhân hóa dành cho khoảng 350 triệu người dùng. Hệ thống này sử dụng các thuật toán heuristic để xác định những ngày nghe nhạc nổi bật và áp dụng mô hình ngôn ngữ để viết nên những câu chuyện ngắn gọn. Khi các nền tảng số ngày càng chuyển từ các chỉ số thống kê đơn thuần sang những bản tóm tắt mang tính kể chuyện, vấn đề cân bằng giữa những thông tin thú vị và bảo vệ quyền riêng tư của người dùng đang trở nên cấp thiết hơn bao giờ hết.

Spotify Wrapped ArchiveSpotify Wrapped Archive

Từ số liệu thống kê sang câu chuyện cảm xúc

Tính năng Wrapped năm nay không chỉ dừng lại ở việc liệt kê các nghệ sĩ được nghe nhiều nhất. Thay vào đó, hệ thống xác định tối đa năm "ngày đáng nhớ" cho mỗi người nghe. Các kỹ sư của Spotify đã thiết lập một tập hợp các quy tắc heuristic có thứ tự ưu tiên, bao gồm các chỉ số đơn giản như ngày có số phút nghe nhạc hoặc podcast nhiều nhất, ngày khám phá nhiều nghệ sĩ mới nhất, hoặc ngày một nghệ sĩ/thể loại chiếm ưu thế.

Các quy tắc tinh tế hơn sẽ bắt lấy những ngày hoài niệm nhất, khi những bài hát cũ hoặc nhạc "quay trở lại" bùng nổ, cũng như ngày người dùng nghe những thể loại xa lạ nhất với gu thường ngày của họ. Các mốc thời gian như sinh nhật hoặc ngày đầu năm mới cũng được đưa vào danh sách ứng viên. Những sự kiện này được xếp hạng dựa trên tiềm năng kể chuyện và sức mạnh thống kê, từ đó chọn ra tối đa năm sự kiện để xây dựng câu chuyện.

Một mô hình ngôn ngữ được tinh chỉnh (fine-tuned LLM) sau đó sẽ được sử dụng để soạn thảo các đoạn văn bản tường thuật dựa trên dữ liệu này, biến các con số khô khan thành những câu chuyện mang tính cá nhân cao.

Xu hướng tóm tắt dữ liệu dạng kể chuyện

Việc tóm tắt hoạt động sử dụng đang ngày càng phổ biến trong các tổ chức dựa trên dữ liệu nhằm làm phong phú thêm trải nghiệm người dùng. OpenAI có "tóm tắt cuối năm" cho ChatGPT liệt kê các chủ đề trò chuyện và đếm tin nhắn, Strava cung cấp "Year in Sport" với dữ liệu hiệu suất, và Steam dùng Replay để giúp người dùng hiểu rõ cách họ tiêu thời gian.

Sự phổ biến của các bản tóm tắt dạng kể chuyện này đã làm nổi bật những lo ngại về quyền riêng tư. Trước đây, các tính năng tổng kết năm thường chỉ báo cáo các con số thô như giờ nghe, nghệ sĩ được chơi nhiều nhất. Tuy nhiên, Wrapped Archive của Spotify nhằm mục đích kể "câu chuyện của năm bạn", làm nổi bật những khoảnh khắc cuộc đời thông qua hành vi tiêu thụ nội dung.

Cán cân giữa lợi ích và quyền riêng tư

Nick Seaver, một học giả về công nghệ truyền thông, nhận định rằng một số nhà phê bình coi các tính năng như vậy là việc bình thường hóa việc theo dõi dữ liệu hay giám sát, ngay cả khi người dùng thích thú khi nhìn lại. Tạp chí The Atlantic nhận xét rằng trong "mùa tổng kết", chính các hành vi của người dùng trở thành sản phẩm, và việc xem lại dữ liệu có thể thú vị "cho đến khi chúng ta được nhắc nhở rằng mình đang bị theo dõi bao nhiêu".

Spotify tuyên bố trong chính sách quyền riêng tư rằng họ sử dụng các biện pháp bảo vệ kỹ thuật và tổ chức, bao gồm giả danh hóa, mã hóa và các chính sách kiểm soát lưu trữ để ngăn chặn truy cập trái phép và lưu trữ dữ liệu không cần thiết. Người dùng có thể yêu cầu xóa một số dữ liệu, tự xóa thông tin hoặc bật phiên riêng tư để ngăn việc nghe nhạc hiện tại được hiển thị công khai.

Khi ngày càng nhiều dịch vụ áp dụng các bản tóm tắt dạng kể chuyện, sự đánh đổi giữa những thông tin thú vị và quyền riêng tư trở nên phức tạp hơn. Người dùng có thể thích những danh sách phát và bản tóm tắt giúp họ hoài niệm, nhưng họ cũng ngầm đồng ý với việc thu thập và diễn giải dữ liệu liên tục.

Bài viết được tổng hợp và biên soạn bằng AI từ các nguồn tin tức công nghệ. Nội dung mang tính tham khảo. Xem bài gốc ↗