LY Corporation hợp nhất 164 cụm OpenStack thành một để tối ưu hạ tầng đám mây

07 tháng 4, 2026·4 phút đọc

LY Corporation, công ty mẹ của Yahoo! Japan và LINE, đang thay thế nền tảng OpenStack đã tùy biến nặng nề bằng một cụm OpenStack duy nhất với cấu hình chuẩn hơn nhằm nâng cao tính ổn định và khả năng nâng cấp. Họ đồng thời tận dụng các công nghệ mã nguồn mở hiện đại để đẩy mạnh tự động hóa và bảo mật.

LY Corporation hợp nhất 164 cụm OpenStack thành một để tối ưu hạ tầng đám mây

LY Corporation hợp nhất 164 cụm OpenStack thành một để tối ưu hạ tầng đám mây

LY Corporation, công ty mẹ của Yahoo! Japan và LINE, vừa công bố kế hoạch thay thế hạ tầng đám mây OpenStack với nhiều tùy biến phức tạp sang một nền tảng duy nhất, chuẩn hơn và dễ nâng cấp hơn. Động thái này hướng đến việc hợp nhất 164 cụm OpenStack nhỏ lẻ hiện tại chỉ còn một cụm với quy mô lớn, nhằm gia tăng tính ổn định, giảm chi phí và nâng cao khả năng vận hành tự động.

Hệ thống đám mây quy mô khổng lồ

LY Corporation hình thành từ năm 2023 khi Yahoo! Japan sáp nhập với LINE, đồng thời sở hữu các dịch vụ có hàng trăm triệu người dùng ở nhiều quốc gia châu Á. Tập đoàn đang vận hành rất nhiều máy ảo (VM) và máy chủ trên nhiều cụm OpenStack phân tán:

  • Nền tảng đám mây LINE “Verda” với 130.000 máy ảo trên 11.000 máy chủ, trải rộng trên 4 cụm OpenStack.
  • Đám mây Yahoo! Japan “YNW” có 27.000 máy chủ, vận hành trên hơn 160 cụm OpenStack với hơn 160.000 máy ảo.

Việc quản lý song song nhiều cụm lớn dẫn đến chi phí vận hành cao và khó khăn trong việc đồng bộ nâng cấp, cập nhật phần mềm.

Chuyển đổi sang kiến trúc OpenStack chuẩn hơn

Kế hoạch của LY Corporation là xây dựng đám mây mới mang tên “Flava”, chạy trên một cụm OpenStack duy nhất với quy mô khoảng 500 máy chủ và hơn 9.000 máy ảo.

Ông Ryuutarou Inoue - Trưởng nhóm Hạ tầng đám mây của LY - cho biết vấn đề chính của nền tảng cũ nằm ở “quá nhiều tùy biến, khiến việc nâng cấp trở nên cực kỳ khó khăn.” Thay vì tiếp tục sửa đổi sâu hệ thống, họ quyết định lựa chọn phiên bản OpenStack “upstream” (phiên bản gốc, không tùy biến nhiều), và đóng góp các thay đổi cần thiết trở lại dự án mã nguồn mở để có thể nâng cấp dễ dàng hơn.

“Việc loại bỏ những rào cản nâng cấp sẽ giúp chúng tôi duy trì tốc độ cập nhật đều đặn, đảm bảo cả an ninh và tính năng mới được áp dụng liên tục,” ông Inoue chia sẻ.

Ba trụ cột thiết kế Flava

Flava không chỉ là việc gom cụm, mà còn thể hiện triết lý thiết kế nhằm tối ưu độ tin cậy và khả năng phục hồi:

  • Theo đuổi kiến trúc không trạng thái (statelessness): Dữ liệu trên đĩa hệ thống tạm thời được chuyển ra lưu trữ bên ngoài, giảm thiểu mất mát khi máy ảo bị lỗi.
  • Khả năng sẵn sàng do ứng dụng điều khiển: Không cố gắng làm cho lớp hạ tầng đạt độ sẵn sàng tuyệt đối mà phối hợp giữa hạ tầng và kiến trúc ở mức ứng dụng để giảm độ phức tạp.
  • Phục hồi nhanh chóng: Ưu tiên giữ dịch vụ vận hành liên tục thay vì phục hồi chính xác trạng thái trước đó, nhờ các quy trình xây dựng lại môi trường nhanh qua Infrastructure as Code (IaC).

Bên cạnh đó, nhóm kỹ sư áp dụng các công cụ giám sát hiện đại như Prometheus, Grafana và các bảng điều khiển nội bộ để liên tục theo dõi sức khỏe đám mây, phát hiện sớm các bất thường. Khi có sự cố, họ sẽ truy vết sâu tới các dấu hiệu cấp kernel hoặc phân tích gói tin mạng để xác minh nguyên nhân.

Tự động hóa và bảo mật nâng cao

Inoue tiết lộ họ đã tự động hóa gần như toàn bộ quy trình từ phát hiện lỗi phần cứng, xử lý tại trung tâm dữ liệu đến tái tích hợp phần cứng mới vào cụm đám mây. Tuy nhiên vẫn có những trường hợp phức tạp cần kỹ sư can thiệp trực tiếp.

Đáng chú ý, LY đang nghiên cứu ứng dụng mô hình ngôn ngữ lớn (large language models) để hỗ trợ tự động hóa các công việc ra quyết định, xa hơn nữa là giảm tải cho con người trong các tình huống sự cố tinh vi.

Động thái chuyển đổi này rất cần thiết cho LY, nhất là sau các sự cố về bảo mật làm lộ dữ liệu người dùng gây ảnh hưởng nghiêm trọng, khiến chính phủ Nhật Bản yêu cầu nâng cấp hệ thống công nghệ và tăng cường bảo vệ quyền riêng tư.

Kết luận

LY Corporation với quy mô hạ tầng OpenStack khổng lồ đã quyết tâm cải tổ mạnh mẽ bằng cách hợp nhất các cụm đám mây, chuyển sang phiên bản OpenStack chuẩn cùng chiến lược thiết kế mới. Đây là một ví dụ điển hình về cách các ông lớn công nghệ châu Á tối ưu hóa đám mây mở, cân bằng giữa tùy biến và bền vững, đồng thời nâng cao năng lực tự động hóa và bảo mật để phục vụ hàng trăm triệu người dùng.

Bài viết được tổng hợp và biên soạn bằng AI từ các nguồn tin tức công nghệ. Nội dung mang tính tham khảo. Xem bài gốc ↗