Kured: Giải pháp tự động khởi động lại node an toàn cho Kubernetes

30 tháng 4, 2026·2 phút đọc

Kured (KUbernetes REboot Daemon) là một daemonset của Kubernetes giúp thực hiện việc khởi động lại các node một cách tự động và an toàn khi hệ điều hành yêu cầu. Công cụ này đảm bảo chỉ một node được reboot tại một thời điểm và tích hợp quy trình cordon/drain để tránh gián đoạn dịch vụ.

Kured: Giải pháp tự động khởi động lại node an toàn cho Kubernetes

Kured: Giải pháp tự động khởi động lại node an toàn cho Kubernetes

Kured (KUbernetes REboot Daemon) là một công cụ hữu ích giúp quản lý việc khởi động lại các node trong cụm Kubernetes một cách tự động và an toàn. Thay vì can thiệp thủ công, Kured giám sát các tín hiệu từ hệ điều hành và đảm bảo quy trình reboot không làm gián đoạn dịch vụ đang chạy.

Kured là gì?

Kured là một daemonset của Kubernetes được thiết kế để xử lý nhu cầu khởi động lại node xuất phát từ hệ điều hành bên dưới. Khi hệ thống cần reboot (ví dụ: sau khi cập nhật kernel hoặc bản vá bảo mật), Kured sẽ nhận diện tín hiệu này và thực hiện quy trình khởi động lại một cách có kiểm soát.

Đây là một dự án Sandbox của Cloud Native Computing Foundation (CNCF), đảm bảo tiêu chuẩn và sự tin cậy cho các hệ thống cloud native hiện đại.

Các tính năng nổi bật

Kured cung cấp nhiều tính năng mạnh mẽ giúp các quản trị viên hệ thống giảm bớt gánh nặng vận hành:

  • Giám sát Sentinel: Kured theo dõi sự hiện diện của file sentinel (ví dụ: /var/run/reboot-required) hoặc kết quả thực thi của một lệnh sentinel cụ thể để biết khi nào node cần reboot.
  • Khóa phân tán: Công cụ sử dụng một khóa trên API server để đảm bảo rằng tại bất kỳ thời điểm nào, chỉ có một node duy nhất được khởi động lại. Điều này giúp tránh việc quá nhiều node offline cùng lúc.
  • Tương thích với Prometheus: Kured có thể hoãn việc khởi động lại nếu có các cảnh báo Prometheus đang hoạt động hoặc các pod được chọn định trước vẫn đang chạy.
  • Quy trình Cordon và Drain: Trước khi reboot, Kured tự động cordon (đánh dấu không lên lịch) và drain (di chuyển pod sang node khác) worker node. Sau khi khởi động lại xong, nó sẽ uncordon node để đưa nó trở lại hoạt động bình thường.

CNCF Sandbox ProjectCNCF Sandbox Project

Tài liệu và Hỗ trợ

Người dùng có thể tìm thấy toàn bộ tài liệu hướng dẫn về cài đặt, cấu hình và vận hành Kured tại trang chủ chính thức kured.dev.

Nếu bạn gặp vấn đề hoặc muốn đóng góp ý tưởng, hãy tham gia kênh #kured trên Slack của CNCF, tạo issue trên GitHub hoặc tham gia các cuộc họp định kỳ hàng tháng của dự án. Kured tuân thủ Bộ quy tắc ứng xử của CNCF và luôn chào đón sự phản hồi từ cộng đồng.

Bài viết được tổng hợp và biên soạn bằng AI từ các nguồn tin tức công nghệ. Nội dung mang tính tham khảo. Xem bài gốc ↗