Quản trị viên IT xin ngừng hệ thống vào giờ ăn trưa và gặp rắc rối lớn
Một quản trị viên IT đã học được bài học đắt giá về sự lạc quan khi cố gắng nâng cấp máy chủ trong giờ nghỉ trưa. Câu chuyện về một ổ cứng bị lỗi và sự may mắn thoát mất việc làm.

Lạc quan luôn tiềm ẩn rủi ro, và phần cứng bị lỗi khiến mọi chuyện trở nên khó xử hơn bao giờ hết.
Chào mừng bạn đến với chuyên mục "Who, Me?" của The Register, nơi chúng tôi khởi động tuần mới bằng những câu chuyện thú vị từ chính các độc giả. Đây là nơi các bạn đọc thừa nhận những sai lầm của mình và chia sẻ cách họ thoát hiểm khỏi những tình huống dở khóc dở cười.
Tuần này, chúng ta sẽ gặp một độc giả mà chúng ta sẽ gọi giả danh là "Hugh". Vào đầu những năm 1990, Hugh làm quản trị viên IT cho một công ty phân phối tại Canada.
"Ứng dụng kinh doanh cốt lõi của công ty chạy trên các thiết bị đầu cuối nối tiếp kết nối với một máy chủ SCO," Hugh chia sẻ với The Register.
Vào thời điểm đó, RAID là một công nghệ mới và đắt đỏ. Do đó, Hugh hài lòng với việc chỉ sử dụng một ổ đĩa duy nhất và chế độ dự phòng dựa vào việc sao lưu dữ liệu (backup) sang băng từ mỗi đêm.
Cách đánh cược này đã thành công... cho đến khi ổ đĩa duy nhất bị đầy, buộc phải thực hiện nâng cấp.
Quá trình nâng cấp diễn ra suôn sẻ khi máy chủ chấp nhận ổ đĩa mới ngay lập tức và sau vài lần khởi động lại, hoạt động kinh doanh đã được phục hồi.
Hugh rất vui mừng, nhưng cũng hơi khó chịu vì quá trình nâng cấp làm lộ ra hệ thống dây điện xung quanh máy chủ khá lộn xộn. Một cách thận trọng, anh muốn dọn dẹp chúng dù điều này đồng nghĩa với việc phải tắt nguồn máy chủ một lần nữa.
"Vì việc này không tốn nhiều thời gian, tôi được phép thực hiện trong giờ ăn trưa," Hugh kể lại.
Hugh hoàn thành công việc trong vòng 60 phút, nhấn nút nguồn của máy chủ và chờ đợi dịch vụ恢复正常 nhanh chóng.
"Nó chỉ ngồi đó im lìm," anh viết. "Tôi tháo nắp trước của máy chủ ra và thấy đèn LED trên mặt trước của ổ đĩa đang nhấp nháy một mã lỗi. Tôi tắt nguồn máy chủ, đợi một chút rồi thử lại. Kết quả vẫn y như cũ."
Câu chuyện này diễn ra trong thời kỳ chưa có Google, nên cách duy nhất để Hugh tìm kiếm sự trợ giúp là gọi điện đến đường dây hỗ trợ của nhà sản xuất ổ đĩa.
"Họ đang nghỉ ăn trưa," anh viết. "Với mồ hôi đầm đìa, tôi đã phải chờ đợi 30 phút dài đằng đẵng cho đến khi đường dây hỗ trợ mở lại."
Ngay sau đó, anh biết được rằng một linh kiện sâu bên trong ổ đĩa đã bị hỏng, có thể xảy ra ngay sau khi anh lắp đặt nó trong lần nâng cấp đầu tiên. Chi tiết đó không cần thiết để ổ đĩa khởi động, điều này giải thích tại sao máy chủ đã sống sót qua vài lần khởi động lại trước đó. Nhưng việc dọn dẹp dây điện của Hugh đã chính thức "giết chết" ổ đĩa.
Công ty của Hugh đã đặt mua một ổ đĩa mới, và ngay khi nó đến, một loạt hoạt động khẩn trương đã đưa doanh nghiệp trở lại cuộc sống.
"May mắn thay, chủ lao động của tôi rất thấu hiểu rằng khả năng xảy ra sự cố như thế này là cực kỳ hiếm và gần như không thể dự đoán trước được, nên tôi đã giữ được công việc của mình," Hugh viết. "Và sau đó chúng tôi đã đầu tư vào một bộ điều khiển RAID và ổ đĩa thứ hai."
Câu chuyện có cái kết có hậu vì hơn 30 năm sau, Hugh đã chuyển sang làm việc tự do, nhưng nhà phân phối kia vẫn là một trong số những khách hàng của anh!
Bạn có bao giờ đặt ra một thời hạn ngắn một cách lạc quan và rồi làm hỏng việc không? Nếu có, đừng bỏ lỡ cơ hội chia sẻ câu chuyện của bạn với "Who, Me?". Hãy nhấp vào đây để gửi email cho chúng tôi để chúng tôi có thể dành cả tuần để chuẩn bị cho nó trong một cột bài tương lai.



