Bot thu thập dữ liệu LLM làm quá tải máy chủ HTTPS của acme.com

08 tháng 4, 2026·3 phút đọc

Các bot thu thập dữ liệu từ các công ty phát triển mô hình ngôn ngữ lớn (LLM) đã vô tình gây ra sự cố nghiêm trọng cho máy chủ của một trang web cá nhân. Việc tạm thời chặn truy cập HTTPS đã giải quyết được tình trạng nghẽn mạng, nhưng vấn đề này đang ảnh hưởng đến nhiều trang web quy mô nhỏ khác.

Bot thu thập dữ liệu LLM làm quá tải máy chủ HTTPS của acme.com

Bot thu thập dữ liệu LLM làm quá tải máy chủ HTTPS của acme.com

Các bot thu thập dữ liệu từ các công ty phát triển mô hình ngôn ngữ lớn (LLM) đã vô tình gây ra sự cố nghiêm trọng cho máy chủ của một trang web cá nhân. Việc tạm thời chặn truy cập HTTPS đã giải quyết được tình trạng nghẽn mạng, nhưng vấn đề này đang ảnh hưởng đến nhiều trang web quy mô nhỏ khác.

Sự cố mạng kéo dài một tháng

Bắt đầu từ ngày 25 tháng 2, trang web acme.com đã phải đối mặt với các sự cố mạng ngắt quãng kéo dài hơn một tháng. Các triệu chứng bao gồm thời gian phản hồi ping rất cao và tình trạng mất gói tin (packet drops) thường xuyên. Các đợt sự cố này thường kéo dài vài giờ rồi biến mất một thời gian trước khi quay lại.

Vấn đề xuất hiện ngay sau khi nhà cung cấp dịch vụ Internet Sonic thực hiện bảo trì định kỳ và chuyển đổi hệ thống sang một mạng mới. Ban đầu, chủ sở hữu trang web đã làm việc với bộ phận hỗ trợ của Sonic để xác định xem liệu sự thay đổi mạng hay cấu hình của chính mình có phải là nguyên nhân gây ra vấn đề hay không. Mặc dù đã phát hiện và sửa một số lỗi cấu hình, nhưng các sự cố mạng vẫn tiếp diễn.

Phát hiện bất ngờ lúc nửa đêm

Vài ngày trước, trong lúc thức đến 1 giờ sáng vì lo lắng về một đợt sự cố khác, chủ sở hữu trang web quyết định phân tích sâu hơn về lưu lượng truy cập đang nhận được. Một chi tiết thú vị đã được phát hiện: acme.com chạy hai máy chủ web, một cho HTTP rất nhanh và một cho HTTPS khá chậm.

Biểu đồ phân tích sự cố mạngBiểu đồ phân tích sự cố mạng

Giả thuyết được đưa ra là máy chủ HTTPS chậm chạp không thể kịp xử lý lưu lượng. Để kiểm tra, chủ sở hữu đã quyết định đóng cổng 443 (cổng HTTPS). Kết quả là các vấn đề mạng biến mất ngay lập tức và không quay lại cho đến nay.

Tác động của bot LLM và nghẽn mạng

Nguyên nhân sâu xa được cho là trước khi bảo trì vào ngày 25 tháng 2, máy chủ HTTPS có lẽ đang hoạt động cầm chừng. Một sự thay đổi trong quá trình bảo trì — có thể là việc tăng băng thông khả dụng — đã làm mất cân bằng hệ thống. Khi băng thông tăng lên, nhiều bot có thể truy cập đồng thời, khiến máy chủ web bị quá tải.

Khi máy chủ bị quá tải đến mức nhất định, tình trạng nghẽn mạng đã lan sang natd (Network Address Translation daemon). Khi natd cũng bị bão hòa, gói tin bắt đầu bị chậm trễ và mất tích.

Một vấn đề chung của cộng đồng

Việc đóng dịch vụ HTTPS rõ ràng chỉ là giải pháp tạm thời, vì trang web vẫn cần cung cấp kết nối an toàn. Tuy nhiên, giải pháp này không gây ảnh hưởng quá lớn do lưu lượng truy cập hợp pháp của trang web chủ yếu là HTTP (90%) và chỉ có 10% là HTTPS.

Tuy nhiên, đây không chỉ là vấn đề của riêng acme.com. Các công ty LLM không nhắm mục tiêu cụ thể vào trang web này, mà họ đang "tấn công" mọi trang web trên mạng. Ít nhất hai trang web quy mô nhỏ khác cũng đang gặp phải các vấn đề tương tự do hoạt động thu thập dữ liệu này. Cần có những biện pháp thích hợp để giải quyết tình trạng này trước khi nó ảnh hưởng tiêu cực hơn đến hạ tầng internet cá nhân.

Bài viết được tổng hợp và biên soạn bằng AI từ các nguồn tin tức công nghệ. Nội dung mang tính tham khảo. Xem bài gốc ↗