Báo cáo tính sẵn sàng của GitHub tháng 4/2026: Tổng hợp 10 sự cố và các biện pháp khắc phục
Trong tháng 4, GitHub đã trải qua 10 sự cố kỹ thuật gây ảnh hưởng đến hiệu suất dịch vụ, bao gồm lỗi hạ tầng DNS, quá tải do tấn công scraping và các vấn đề với Copilot. Nền tảng này đang triển khai các biện pháp cải thiện để ngăn chặn sự tái diễn và tăng cường tính minh bạch.

Tháng 4 năm 2026 vừa qua là một giai đoạn đầy biến động đối với GitHub khi nền tảng này ghi nhận tổng cộng 10 sự cố kỹ thuật khác nhau gây ảnh hưởng đến hiệu suất của các dịch vụ chính. Để tăng cường tính minh bạch, GitHub đã công bố chi tiết về các sự cố lớn, đặc biệt là vào ngày 23 và 27 tháng 4, đồng thời cam kết thực hiện các khoản đầu tư ngắn hạn và dài hạn để nâng cao độ ổn định hệ thống.
Hình ảnh minh họa báo cáo GitHub
Dưới đây là tóm tắt các sự cố đáng chú ý nhất trong tháng qua:
Sự cố Tìm kiếm Mã nguồn và Hạ tầng
Vào ngày 1/4, dịch vụ Code Search (Tìm kiếm mã nguồn) của GitHub đã gặp sự cố gián đoạn hoàn toàn trong hơn 2 giờ. Nguyên nhân là do một thay đổi tự động quá mức trong hệ thống nhắn tin hỗ trợ tìm kiếm, gây ra lỗi phối hợp giữa các dịch vụ nội bộ. Mặc dù không có dữ liệu kho lưu trữ (repository) nào bị mất, nhưng chỉ mục tìm kiếm đã bị lỗi thời trong một thời gian. GitHub đã phải khởi động lại hạ tầng nhắn tin và đặt lại chỉ mục tìm kiếm để khôi phục dịch vụ.
Đến ngày 13/4, dịch vụ GitHub Pages cũng chịu ảnh hưởng với tỷ lệ lỗi tăng cao do một công cụ quản lý DNS tự động xóa nhầm bản ghi DNS của máy chủ lưu trữ backend. Điều này khiến các máy chủ Pages không thể kết nối với bộ nhớ lưu trữ, dẫn đến hàng triệu yêu cầu thất bại.
Tấn công Scraping và Quá tải Tải (Load Balancer)
Một trong những sự cố nghiêm trọng nhất diễn ra vào ngày 27/4, kéo dài hơn 6 giờ. Lớp cân bằng tải (load balancing tier) đặt trước cơ sở hạ tầng tìm kiếm đã bị bão hòa.
Nguyên nhân được xác định là do một lượng lớn lưu lượng truy cập scraping ẩn danh (thu thập dữ liệu tự động) từ hơn 600.000 địa chỉ IP duy nhất. Lưu lượng này chiếm 30% tổng lưu lượng tìm kiếm trong ngày và được thiết kế để tránh các giới hạn tốc độ của API công cộng. Để khắc phục, GitHub đã mở rộng lớp cân bằng tải và chặn lưu lượng bất thường, đồng thời triển khai các biện pháp mới để hạn chế truy cập ẩn danh nhằm bảo vệ người dùng đã đăng ký.
Hình ảnh minh họa dữ liệu và hạ tầng
Các vấn đề với Copilot và Dịch vụ AI
Dịch vụ AI GitHub Copilot cũng không tránh khỏi các trục trặc. Vào ngày 9/4, người dùng trải qua độ trễ đáng kể khi bắt đầu các phiên làm việc mới với Copilot Coding Agent, với thời gian chờ trong hàng đợi lên tới 54 phút (thông thường chỉ từ 15–40 giây). Nguyên nhân là do lỗi logic trong giới hạn tốc độ (rate limiting) áp dụng sai phạm vi toàn cầu thay vì từng cài đặt riêng lẻ.
Ngoài ra, vào ngày 22/4, người dùng không thể sử dụng Copilot Chat và Copilot Cloud Agent do lỗi thay đổi cấu hình hạ tầng gây ra vấn đề kết nối cơ sở dữ liệu.
Các sự cố khác
- GitHub Codespaces (16/4): Khoảng 40% thao tác khởi chạy codespace thất bại do lỗi ở dịch vụ thượng nguồn khi truy xuất VS Code Server.
- Nhật ký kiểm toán (Audit Log) (1/4): Mất kết nối dữ liệu trong 28 phút do lỗi xoay vòng thông tin xác thực.
- Quét mã và Bảng dự án (20/4): Các phân tích chất lượng mã không được kích hoạt trên pull request mới do lỗi tuần tự hóa.
GitHub khẳng định họ đang nỗ lực cải thiện cơ chế hạ tầng, triển khai các bản nâng cấp dần dần với kiểm tra sức khỏe tốt hơn, và tăng cường khả năng tự phục hồi (self-healing) để giảm thiểu tác động của các sự cố trong tương lai. Người dùng có thể theo dõi trạng thái thời gian thực của GitHub tại trang trạng thái chính thức của họ.
Bài viết liên quan

Công nghệ
Cerebras, đối tác thân thiết của OpenAI, sẵn sàng cho đợt IPO kỷ lục định giá tới 26,6 tỷ USD
04 tháng 5, 2026

AI & ML
Nguy cơ bảo mật từ "Vibe-Coding": Hàng nghìn ứng dụng AI để lộ dữ liệu nhạy cảm trên mạng
07 tháng 5, 2026

Phần mềm
Google tung ra Antigravity 2.0: Ứng dụng lập trình thế hệ mới với công cụ CLI và gói đăng ký AI Ultra
19 tháng 5, 2026
