Tăng cường quyền kiểm soát dữ liệu người dùng: Từ giao thức AT Protocol của BlueSky đến xu hướng Local-First

Phần mềm15 tháng 6, 2026·7 phút đọc

Martin Kleppmann, phó giáo sư Đại học Cambridge và tác giả cuốn "Designing Data-Intensive Applications", thảo luận về sự tiến hóa của hệ thống dữ liệu trong thập kỷ qua. Bài viết làm nổi bật sự chuyển dịch từ kiến trúc đơn lẻ sang các khối xây dựng mô-đun, tầm quan trọng của việc lưu trữ dữ liệu phi tập trung như giao thức AT Protocol của BlueSky, và phong trào "local-first" nhằm trao quyền sở hữu dữ liệu thực sự cho người dùng.

Tăng cường quyền kiểm soát dữ liệu người dùng: Từ giao thức AT Protocol của BlueSky đến xu hướng Local-First

Trong tập podcast gần đây, Martin Kleppmann, phó giáo sư tại Đại học Cambridge và tác giả nổi tiếng của cuốn Designing Data-Intensive Applications (Thiết kế các ứng dụng tập trung dữ liệu), đã có những chia sẻ sâu sắc về sự tiến hóa của hệ thống dữ liệu. Cuộc trò chuyện tập trung vào sự chuyển dịch từ các cơ sở dữ liệu đơn khối (monolithic) sang các khối xây dựng mô-đun, cũng như tầm quan trọng của việc chuyển từ hệ thống lưu trữ dữ liệu dựa trên đám mây sang lưu trữ phi tập trung, điển hình là giao thức AT Protocol của mạng xã hội BlueSky. Ngoài ra, ông còn đi sâu vào phong trào "local-first" (ưu tiên cục bộ) và ý nghĩa của việc người dùng làm chủ dữ liệu của chính mình.

Sự chuyển dịch sang kiến trúc Cloud-Native và lưu trữ đối tượng

Trong thập kỷ qua, ngành công nghệ đã chứng kiến sự trỗi dậy mạnh mẽ của các kiến trúc phần mềm cloud-native (đám mây nguyên bản). Trước đây, khi xây dựng một cơ sở dữ liệu phân tán, các nhà phát triển thường viết phần mềm để lưu trữ dữ liệu trực tiếp trên đĩa cục bộ của mỗi nút (node) và thực hiện sao chép ở mức phần mềm. Tuy nhiên, ngày nay cách tiếp cận này đã thay đổi.

Các hệ thống hiện đại ngày càng được xây dựng dựa trên các đối tượng lưu trữ (object stores) như S3. Tầng lưu trữ cơ bản hiện nay là một đối tượng lưu trữ đã được sao chép nội tại, thay vì là đĩa cục bộ. Sự thay đổi này ảnh hưởng lớn đến cách chúng ta xây dựng các hệ thống ở tầng trên.

Kleppmann chỉ ra một xu hướng thú vị là sự phân mảnh của các hệ thống dữ liệu khổng lồ thành các khối xây dựng (building blocks) nhỏ hơn. Thay vì một hệ thống đơn lẻ, các nhà phát triển giờ đây có thể kết hợp một kho lưu trữ đối tượng từ nhà cung cấp này, định dạng tệp dữ liệu cột từ thư viện khác, và một công cụ truy vấn từ bên thứ ba. Điều này tăng tính linh hoạt, cho phép tùy chỉnh và thử nghiệm các cách tiếp cận mới mà không cần xây dựng lại toàn bộ hệ thống khổng lồ.

Phi tập trung hóa và chủ quyền dữ liệu: Vai trò của các giao thức

Một chủ đề nóng hổi khác được thảo luận là phi tập trung hóa và chủ quyền dữ liệu, đặc biệt thông qua giao thức AT Protocol – nền tảng của mạng xã hội BlueSky. Mục tiêu ban đầu của dự án là xây dựng một hạ tầng công nghệ phi tập trung cho các ứng dụng mạng xã hội, đảm bảo rằng mạng xã hội quá quan trọng để để trong tay một công ty duy nhất.

Khác với ActivityPub (nền tảng của Mastodon) ưu tiên tính liên kết liên minh (federation) tối đa, AT Protocol tập trung vào việc cung cấp trải nghiệm người dùng nhất quán. Trên Mastodon, các luồng trả lời (reply threads) có thể khác nhau tùy theo máy chủ mà bạn truy cập. Ngược lại, AT Protocol sử dụng một cơ chế gọi là Relay (trung chuyển) để tổng hợp tất cả các hoạt động từ các máy chủ dữ liệu cá nhân (PDS) vào một dòng dữ liệu (firehose) duy nhất. Điều này đảm bảo rằng mọi người nhìn thấy cùng một luồng thảo luận và số lượng lượt thích giống nhau, tạo ra trải nghiệm mượt mà tương tự như các mạng xã hội tập trung.

Nguyên tắc cốt lõi của AT Protocol là khả năng chuyển đổi. Người dùng có thể chuyển sang nhà cung cấp dịch vụ khác mà không mất tên người dùng, bài đăng, hay mạng lưới quan hệ xã hội của họ. Đây là một bước tiến lớn trong việc giảm thiểu rủi ro bị khóa bởi nhà cung cấp (vendor lock-in).

Phong trào Local-First: Trao quyền cho người dùng và đảm bảo khả năng kiểm soát dữ liệu

Kleppmann cũng là một người ủng hộ nhiệt thành cho phong trào "local-first". Đây là một nguyên tắc thiết kế phần mềm trong đó bản sao chính của dữ liệu nằm trên thiết bị của người dùng chứ không phải trên đám mây.

Phong trào này giải quyết các vấn đề về quyền kiểm soát dữ liệu (data agency). Khi dữ liệu nằm trên máy của bạn, bạn có thể truy cập ngoại tuyến, phần mềm hoạt động nhanh hơn vì không phải chờ vòng lặp mạng, và quan trọng nhất, bạn không bị phụ thuộc hoàn toàn vào nhà cung cấp dịch vụ đám mây. Nếu một dịch vụ web bị đóng cửa (như trường hợp của Google Reader ngày xưa), người dùng vẫn giữ lại bản sao dữ liệu của mình.

Kleppmann so sánh local-first với Git – nơi tất cả lịch sử commit đều nằm trên máy本地 và bạn có thể đẩy (push) đến nhiều dịch vụ lưu trữ khác nhau cùng lúc. Mô hình này cho phép sử dụng nhiều dịch vụ đám mây song song để đồng bộ dữ liệu, loại bỏ sự phụ thuộc vào một nền tảng duy nhất.

Mang khả năng kiểm soát phiên bản kiểu Git đến dữ liệu phi văn bản

Một trong những thách thức của local-first là làm thế nào để áp dụng sức mạnh của kiểm soát phiên bản (version control) – thứ mà các kỹ sư phần mềm dùng hàng ngày – cho các loại tệp phi văn bản như bảng tính, bản vẽ CAD hay file đồ họa.

Để giải quyết vấn đề này, Kleppmann và cộng sự đã phát triển Automerge, một thư viện mã nguồn mở. Automerge cung cấp mô hình dữ liệu để lưu trữ dữ liệu ứng dụng và tự động đồng bộ giữa các máy tính. Nó cho phép cộng tác thời gian thực và hỗ trợ các trường hợp sử dụng kiểu kiểm soát phiên bản, như tạo nhánh (branch), so sánh diff và hợp nhất (merge).

Thư viện này được viết bằng Rust và biên dịch sang WebAssembly, cho phép nó hoạt động trên trình duyệt web thông qua wrapper TypeScript, cũng như trên iOS (Swift), Android (Java) và nhiều ngôn ngữ khác. Điều này mang lại khả năng kiểm soát phiên bản mạnh mẽ cho các ứng dụng phổ thông, giúp người dùng xem lại các thay đổi trong bảng tính hay bản thiết kế giống như cách họ xem lại code.

Hạn chế và khi nào không nên áp dụng Local-First

Mặc dù local-first mang lại nhiều lợi ích, nhưng nó không phải là giải pháp cho mọi vấn đề. Kleppmann lưu ý rằng mô hình này hoạt động tốt nhất cho các ứng dụng nơi người dùng tự tạo và chỉnh sửa dữ liệu (như tài liệu, bảng tính, công cụ thiết kế).

Ngược lại, nó không phù hợp cho các dữ liệu yêu cầu một bản sao chính thức duy nhất trên máy chủ, như số dư tài khoản ngân hàng hay kho hàng của một cửa hàng trực tuyến. Trong các trường hợp này, việc người dùng chỉnh sửa dữ liệu cục bộ không có giá trị thực tế vì máy chủ mới là nơi nắm giữ trạng thái chính xác của tài nguyên vật lý.

Phong trào local-first và các giao thức như AT Protocol đại diện cho một nỗ lực nhằm trả lại quyền kiểm soát công nghệ cho người dùng. Khi ngày càng nhiều công ty áp dụng các nguyên tắc này, chúng ta có thể hy vọng vào một tương lai nơi dữ liệu của người dùng được bảo vệ tốt hơn, linh hoạt hơn và không bị ràng buộc bởi sự sinh tồn của bất kỳ một công ty công nghệ nào.

Chia sẻ:FacebookX
Nội dung tổng hợp bằng AI, mang tính tham khảo. Xem bài gốc ↗