GitHub âm thầm bật tính năng thu thập dữ liệu cho người dùng CLI mặc định

22 tháng 4, 2026·3 phút đọc

GitHub đã âm thầm bật mặc định tính năng thu thập dữ liệu telemetry ẩn danh cho người dùng giao diện dòng lệnh (CLI). Mục tiêu được cho là để cải thiện sản phẩm và theo dõi cách các tác nhân AI sử dụng công cụ, nhưng người dùng quan tâm đến quyền riêng tư cần thực hiện thủ tục để từ chối.

GitHub âm thầm bật tính năng thu thập dữ liệu cho người dùng CLI mặc định

Người dùng giao diện dòng lệnh (CLI) của GitHub coi trọng quyền riêng tư cần cảnh giác. Nền tảng lưu trữ mã nguồn thuộc sở hữu của Microsoft đã âm thầm bắt đầu thu thập dữ liệu telemetry phía máy khách dưới dạng giả danh từ người dùng CLI và bật tính năng này theo mặc định.

Không có bài đăng blog hay thông báo chính thức nào về thay đổi này. Thay vào đó, GitHub chỉ cập nhật tài liệu CLI, thêm một trang về telemetry, ghi chú về dữ liệu giả danh trong bản phát hành mới và cập nhật mã nguồn cho CLI trong tuần qua để tích hợp tính năng này. Lý giải của GitHub khá đơn giản: dữ liệu này sẽ giúp nhóm phát triển hiểu rõ hơn về cách sử dụng tính năng và cải thiện CLI.

Và tất nhiên, là vì AI.

"Khi việc áp dụng các tác nhân (agents) vào GitHub CLI ngày càng tăng, nhóm của chúng tôi cần có khả năng quan sát cách các tính năng được sử dụng trong thực tế," trang tài liệu về telemetry cho biết. "Chúng tôi sử dụng dữ liệu này để ưu tiên công việc và đánh giá xem các tính năng có đáp ứng nhu cầu thực sự của người dùng hay không." Trong trường hợp này, "người dùng thực" dường như bao gồm cả các tác nhân AI.

Về mặt lý thuyết, đây không phải là một ý tưởng tồi: các công ty cần biết người dùng tương tác với phần mềm như thế nào và những tính năng nào đáng để đầu tư thời gian hơn. Vì vậy, việc GitHub thêm tính năng này không quá ngạc nhiên. Tuy nhiên, điều khó chấp nhận hơn là việc bật telemetry theo mặc định mà không thông báo rõ ràng về những dữ liệu cụ thể có thể bị thu thập bởi CLI.

Có rất nhiều mã mới để kiểm tra trong kho lưu trữ CLI với nhiều lần đề cập đến telemetry, nhưng không có danh sách cụ thể nào về các điểm dữ liệu có thể được bao gồm. GitHub không liệt kê mọi thứ chi tiết trên trang telemetry, thay vào đó lưu ý rằng người dùng có thể kiểm tra những gì sẽ được gửi bằng cách bật tính năng ghi nhật ký (logging).

"Nếu bạn muốn xem chính xác những gì sẽ được gửi mà không thực sự gửi nó đi, bạn có thể bật ghi nhật ký," trang trợ giúp cho biết trước khi cung cấp mẫu về những gì có thể ở trong đó. Tải trọng mẫu bao gồm trường tác nhân (agent), kiến trúc, ID thiết bị, hệ điều hành, các cờ (flags), tên lệnh, ID gọi và siêu dữ liệu khác. GitHub lưu ý rằng các tải trọng telemetry thực tế có thể khác nhau đáng kể.

Dữ liệu telemetry được thu thập từ các máy khách CLI sẽ được gửi đến cơ sở hạ tầng phân tích nội bộ của GitHub, nhưng điều đó có thể vẫn chưa đủ để xoa dịu những lo ngại của những người hiện đang phải giao thêm dữ liệu cho Microsoft và GitHub mà không có nhiều thông báo trước. May mắn thay, GitHub đã đưa ra hướng dẫn từ chối (opt-out) trên trang Telemetry mới.

Việc từ chối có thể thực hiện thông qua biến môi trường hoặc tùy chọn cấu hình trong chính CLI. Đối với biến môi trường, GitHub cho biết xuất lệnh GH_TELEMETRY=false (hoặc bất kỳ giá trị nào tương đương với false) sẽ hoạt động, cũng như thiết lập DO_NOT_TRACK=true.

Đối với những người muốn thay đổi trong tệp cấu hình của CLI, hãy sử dụng lệnh gh config set telemetry disabled để tắt tính năng này.

GitHub chưa phản hồi các câu hỏi liên quan đến câu chuyện này.

Bài viết được tổng hợp và biên soạn bằng AI từ các nguồn tin tức công nghệ. Nội dung mang tính tham khảo. Xem bài gốc ↗