CEO LlamaIndex: Lớp "giàn giáo" trong phát triển AI đang sụp đổ, điều gì sẽ tồn tại?

Jerry Liu, CEO của LlamaIndex, nhận định rằng các lớp hỗ trợ kỹ thuật phức tạp từng cần thiết để xây dựng ứng dụng LLM đang dần biến mất. Theo ông, sự trỗi dậy của các tác nhân viết mã (coding agents) và khả năng lý luận vượt trội của các mô hình mới đang thay đổi hoàn toàn cách phát triển phần mềm, biến ngôn ngữ tự nhiên thành công cụ chính và đặt "ngữ cảnh" dữ liệu làm yếu tố cạnh tranh cốt lõi.

Jerry Liu, đồng sáng lập và CEO của LlamaIndex, cho rằng sự sụp đổ này không phải là vấn đề, mà chính là mục tiêu hướng tới của sự phát triển công nghệ.

"Kết quả là, nhu cầu sử dụng các khung công tác (framework) để giúp người dùng soạn thảo các quy trình làm việc xác định theo cách nhẹ nhàng và hời hợt đang giảm đi," Jerry Liu chia sẻ trong podcast mới đây của VentureBeat.

Ngữ cảnh đang trở thành "hào bảo vệ"

LlamaIndex là một trong những khung công tác hàng đầu về Tạo sinh tăng cường truy xuất (RAG), giúp kết nối dữ liệu riêng tư, tùy chỉnh và chuyên ngành với các Mô hình Ngôn ngữ Lớn (LLM). Tuy nhiên, ngay cả ông Liu cũng thừa nhận rằng các loại khung công tác này đang trở nên ít phù hợp hơn.

Với mỗi bản cập nhật mới, các mô hình thể hiện khả năng lý luận ngày càng tốt hơn trên "lượng khổng lồ" dữ liệu phi cấu trúc, thậm chí vượt trội hơn con người. Chúng có thể tin cậy để tự lý luận, tự sửa lỗi và lập kế hoạch đa bước. Các giao thức như Modern Context Protocol (MCP) và các plug-in Claude Agent Skills cho phép các mô hình tự khám phá và sử dụng công cụ mà không cần tích hợp riêng lẻ từng cái.

Các mô hình tác nhân (agent patterns) đã được hợp nhất theo hướng mà Liu gọi là "sơ đồ tác nhân được quản lý" (managed agent diagram) — một lớp điều khiển kết hợp với công cụ, trình kết nối MCP và các plug-in kỹ năng, thay vì việc điều phối tùy chỉnh cho từng quy trình làm việc.

Hơn nữa, các tác nhân viết mã hiện nay xuất sắc trong việc tạo ra mã, nghĩa là các nhà phát triển không cần phụ thuộc quá nhiều vào các thư viện khổng lồ. Thực tế, khoảng 95% mã của LlamaIndex được tạo ra bởi AI.

"Các kỹ sư thực sự không còn viết mã thật," Liu nói. "Họ đều đang gõ bằng ngôn ngữ tự nhiên."

Điều này có nghĩa là rào cản giữa lập trình viên và người không biết lập trình đang bị xóa nhòa, bởi "ngôn ngữ lập trình mới về cơ bản là tiếng Anh".

Thay vì viết mã thủ công hoặc vật lộn để hiểu cách tích hợp API và tài liệu, các nhà phát triển giờ đây có thể chỉ cần hướng dẫn Claude Code thực hiện việc đó.

"Loại công việc này từng cực kỳ kém hiệu quả hoặc sẽ làm hỏng tác nhân cách đây ba năm," Liu nhận định. "Bây giờ, việc xây dựng các tính năng truy xuất tương đối nâng cao bằng các nguyên thủy cực kỳ đơn giản đã trở nên dễ dàng hơn nhiều."

Vậy thì, khi toàn bộ stack công nghệ sụp đổ, yếu tố nào tạo nên sự khác biệt cốt lõi?

Đó chính là Ngữ cảnh (Context), Liu khẳng định. Các tác nhân cần có khả năng giải mã các định dạng tệp để trích xuất thông tin đúng đắn. Việc cung cấp khả năng phân tích cú pháp chính xác hơn và rẻ hơn trở thành chìa khóa, và LlamaIndex đang ở vị thế tốt ở khía cạnh này nhờ những phát triển của họ về xử lý tài liệu tác nhân thông qua nhận dạng ký tự quang học (OCR).

"Chúng tôi đã thực sự xác định được một tập dữ liệu cốt lõi đang bị khóa chặt trong tất cả các vùng chứa định dạng tệp này," ông nói. Cuối cùng, "bạn có sử dụng OpenAI Codex hay Claude Code không thực sự quan trọng. Điều mà tất cả chúng cần là ngữ cảnh."

Giữ cho kiến trúc luôn mô đun và linh hoạt

Ngày càng có nhiều lo ngại về việc các nhà xây dựng như Anthropic khóa chặt dữ liệu phiên làm việc. Trước tình hình đó, Liu nhấn mạnh tầm quan trọng của tính mô đun và tính trung lập. Các nhà xây dựng không nên đặt cược vào bất kỳ mô hình tiên phong nào, hoặc xây dựng quá mức theo cách làm phức tạp hóa các thành phần của stack.

Quy trình truy xuất đã phát triển thành "tác nhân cộng với sandbox" (agent-plus-sandbox), như ông mô tả, và các doanh nghiệp phải đảm bảo rằng cơ sở mã của họ không bị nợ kỹ thuật và có thể thích ứng với các mô hình thay đổi. Họ cũng phải thừa nhận rằng một số phần của stack cuối cùng sẽ cần bị loại bỏ như một quy trình tất yếu.

"Bởi vì với mỗi lần phát hành mô hình mới, luôn có một mô hình khác trở thành người chiến thắng," Liu nói. "Bạn muốn đảm bảo mình thực sự có một số sự linh hoạt để tận dụng điều đó."

Nghe podcast để tìm hiểu thêm về:

Khởi đầu của LlamaIndex như một "dự án đồ chơi" với độ chính xác ban đầu chỉ khoảng 40%.
Cách các công ty SaaS có thể khai thác các quy trình làm việc phức tạp phải được chuẩn hóa và có thể lặp lại cho người lao động tri thức bình thường.
Tại sao các công ty AI theo chiều dọc (vertical AI) đang cất cánh và tại sao câu hỏi "tự xây hay mua" (build versus buy) vẫn là một câu hỏi rất hợp lý trong kỷ nguyên của các tác nhân.

CEO LlamaIndex: Lớp "giàn giáo" trong phát triển AI đang sụp đổ, điều gì sẽ tồn tại?

Ngữ cảnh đang trở thành "hào bảo vệ"

Giữ cho kiến trúc luôn mô đun và linh hoạt

Bài viết liên quan