Grafana Tái Kiến Trúc Loki Với Kafka và Ra mắt CLI GCX Kết Nối Observability Vào AI Coding Agents
Tại GrafanaCON 2026, Grafana Labs đã công bố Grafana 13 cùng với kiến trúc mới của Loki sử dụng Kafka để tối ưu hóa hiệu suất và giảm chi phí lưu trữ. Đồng thời, công ty cũng giới thiệu công cụ dòng lệnh GCX giúp tích hợp dữ liệu giám sát trực tiếp vào các môi trường lập trình AI.

Tại hội nghị GrafanaCON 2026 diễn ra tại Barcelona, Grafana Labs đã công bố phiên bản Grafana 13 với những cải tiến mang tính bước ngoặt. Đáng chú ý nhất là việc tái kiến trúc hệ thống logging Loki sử dụng Kafka ở lớp thu thập dữ liệu (ingestion layer), cũng như sự ra mắt của tính năng AI Observability trong Grafana Cloud và công cụ dòng lệnh GCX mới.
Tái kiến trúc Loki: Tạm biệt sao chép, chào đón Kafka
Loki, hệ thống log phổ biến của Grafana, đang thay đổi cách tiếp cận kiến trúc để giải quyết vấn đề hiệu suất và chi phí. Trước đây, Loki đạt tính sẵn sàng cao (high availability) thông qua cơ chế sao chép: mỗi dòng log đầu vào được gửi đến ba ingester, tạo ra hệ số sao chép là ba.
/filters:no_upscale()/news/2026/04/grafana-loki-ai-agents/en/resources/1Loki architecture-1776936739145.jpg)
Tuy nhiên, thực tế vận hành lại phức tạp hơn. Trevor Whitney, Kỹ sư phần mềm cấp cao tại Grafana Labs, giải thích rằng cơ chế khử trùng lặp (deduplication) dựa trên tên tệp gặp vấn đề khi các ingester bị lệch thời gian. Điều này dẫn đến việc hệ thống lưu trữ trung bình 2,3 bản sao cho mỗi dòng log, gây lãng phí tài nguyên ở mọi khâu từ CPU, bộ nhớ, chi phí mạng đến lưu trữ đối tượng (object storage).
Kiến trúc mới thay thế chiến lược sao chép tại lớp ingestion bằng cách sử dụng Kafka làm lớp bền vững (durability layer). Logs được ghi vào Kafka một lần duy nhất, sau đó các ingester sẽ tiêu thụ dữ liệu từ hàng đợi này. Điều này giúp hệ số sao chép hiệu quả giảm xuống còn một. Kết hợp với động cơ truy vấn được thiết kế lại để phân phối công việc song song, Grafana tuyên bố giảm tới 20 lần lượng dữ liệu cần quét và tăng tốc độ 10 lần cho các truy vấn tổng hợp.
Tất nhiên, sự thay đổi này đi kèm một sự đánh đổi. Nguyên tắc thiết kế ban đầu của Loki là tối thiểu hóa sự phụ thuộc (chỉ cần object storage). Với kiến trúc mới, các bản cài đặt Loki phân tán sẽ cần thêm Kafka. Tuy nhiên, các bản triển khai đơn lẻ (single-binary) hoặc lab cá nhân sẽ không bị ảnh hưởng và vẫn có thể chạy chỉ với hệ thống tệp hoặc object storage.
GCX CLI: Xóa nhòa ranh giới giữa Observability và AI Coding
Một trong những điểm nhấn thú vị khác là sự ra mắt của GCX, một công cụ dòng lệnh (CLI) mới nhằm đưa khả năng quan sát (observability) vào quy trình làm việc của các tác nhân AI (AI agents).
Hiện nay, nhiều kỹ sư dành phần lớn thời gian làm việc trong các môi trường lập trình hỗ trợ AI như Claude Code, Cursor hoặc GitHub Copilot. Khi sự cố xảy ra, họ thường phải chuyển đổi ngữ cảnh (context switch) sang trình duyệt để xem Grafana, rồi quay lại editor sửa lỗi, và lại quay lại Grafana để kiểm tra. GCX được thiết kế để khép kín vòng lặp này.
Ward Bekker, người đứng đầu dự án GCX, nhận định rằng các công cụ CLI đang trở nên thời thượng hơn nhờ sự bùng nổ của các công cụ lập trình dựa trên tác nhân AI. Trong một bản demo, Bekker mô tả kịch bản: một kiểm tra giám sát tổng hợp phát hiện lỗi trên quy trình đặt hàng thương mại điện tử; Grafana Assistant chạy phân tích nguyên nhân gốc rễ tự động; GCX kéo kết quả phân tích đó vào Claude Code cùng với các tệp mã nguồn liên quan; Claude Code đề xuất và áp dụng bản sửa lỗi; sau đó GCX truy vấn các chỉ số giám sát để xác nhận hệ thống đã hồi phục. Tất cả mà không cần mở tab trình duyệt nào.
Grafana Labs không đặt cược vào một mô hình tích hợp duy nhất. Bên cạnh GCX CLI, họ đang phát triển song song một máy chủ MCP (Model Context Protocol) từ xa để phục vụ các đối tượng và trường hợp sử dụng khác nhau.
Các cập nhật khác trong Grafana 13
Bên cạnh những thay đổi lớn nói trên, Grafana 13 cũng mang đến nhiều tính năng mới:
- Bảng điều khiển động (Dynamic Dashboards): Chính thức có sẵn (GA).
- Hỗ trợ quy trình làm việc dựa trên Git: Giúp quản lý cấu hình tốt hơn.
- Hệ sinh thái nguồn dữ liệu: Mở rộng lên hơn 170 tích hợp.
Ngoài ra, Grafana Labs cũng ra mắt sản phẩm AI Observability trong bản xem trước công khai, dành cho các nhóm đang giám sát các ứng dụng sử dụng LLM (Mô hình ngôn ngữ lớn) trong môi trường sản xuất.
Hiện tại, Grafana 13 và các bản cập nhật Loki đã sẵn sàng sử dụng. GCX và giải pháp AI Observability đang trong giai đoạn public preview trên Grafana Cloud.
Bài viết liên quan

Phần mềm
Google Giới Thiệu Room 3.0: Thư Viện Persistence Đa Nền Tảng, Ưu Tiên Kotlin Và Hỗ Trợ Async
23 tháng 4, 2026

Công nghệ
X "khai tử" tính năng Communities vì đầy rẫy spam và thiếu sự quan tâm
23 tháng 4, 2026

Công nghệ
Microsoft lần đầu tiên trong lịch sử triển khai chương trình nghỉ hưu tự nguyện cho nhân viên lâu năm
23 tháng 4, 2026
