Cơn sốt vàng LLM trên đám mây đã chấm dứt: Bài học từ Apple và tương lai của AI nội bộ
Tuyên bố của Apple tại WWDC về việc đưa AI xử lý cục bộ lên macOS đánh dấu sự thay đổi lớn trong ngành, cho thấy thời kỳ bùng nổ của các LLM trên đám mây đang đi đến hồi kết. Bài viết phân tích những hạn chế của mô hình ngôn ngữ xác suất và xu hướng chuyển dịch sang các ứng dụng AI thực dụng, hiệu quả hơn.

Cơn sốt vàng LLM trên đám mây đã chấm dứt: Bài học từ Apple và tương lai của AI nội bộ
Vài ngày trước, Apple đã tổ chức sự kiện WWDC và công bố những điều đi xa hơn việc chỉ cải thiện Siri. Đó thực chất là một tín hiệu cho thấy thế giới AI hiện tại trông như thế nào và nó sẽ đi về đâu.
Apple tin rằng đối với hầu hết các trường hợp sử dụng, chúng ta không cần các Mô hình Ngôn ngữ Lớn (LLM) dựa trên đám mây. Họ đã quyết định rằng macOS nên trở thành một hệ thống có khả năng AI, xử lý các quy trình công việc và tác vụ ngay tại thiết bị (local). Các hệ thống đám mây chỉ được sử dụng khi thực sự cần thiết.
Ảnh minh họa từ Anthropic
Điều này hoàn toàn hợp lý. Người dùng sẽ không cần phải trả phí thuê bao hàng tháng nếu chiếc Mac của họ có đủ sức mạnh để chạy các tác vụ và tự động hóa AI một cách tự nhiên. Điều này có nghĩa là gì với chúng ta? Có lẽ hầu hết các quy trình tự động hóa và kỹ năng Claude của chúng ta cuối cùng sẽ chạy trực tiếp trên máy Mac. Chúng ta có thể sẽ phải xây dựng lại các ứng dụng của mình.
Vậy điều gì sẽ xảy ra với các LLM?
Các LLM trên đám mây đang gợi ý về hướng đi của chúng: các công việc AI tiên tiến như tác nhân (agents), khai thác dữ liệu và các tác vụ suy luận sâu. Đây là những công việc chuyên môn hóa, không còn là hạ tầng mặc định như trước đây.
LLM thực sự hữu ích, nhưng hy vọng và trí tưởng tượng của chúng ta có thể đã đóng vai trò trong việc hiểu sai về những gì chúng thực sự giỏi. LLM có một hạn chế về mặt thiết kế: chúng mang tính xác suất (probabilistic). Các hệ thống xác suất diễn giải ngữ cảnh; chúng không thực thi với sự chắc chắn (deterministic).
Yêu cầu một LLM quét hóa đơn và luôn cập nhật cơ sở dữ liệu một cách chính xác là một hy vọng hơn là một giải pháp. Trường hợp sử dụng này ép buộc một hệ thống xác suất phải hoạt động như một hệ thống xác định. Vậy tại sao không sử dụng một hệ thống xác định thay thế? Nhiều người dùng sớm có kinh nghiệm sẽ không đồng ý, nhưng tôi rất muốn biết họ tốn bao nhiêu tín dụng cho mỗi giao dịch trong các hệ thống tác nhân của mình, cần bao nhiêu thời gian bảo trì và mất bao lâu để xây dựng. Và sau đó tôi sẽ hỏi: Tại sao không sử dụng LLM để xây dựng công cụ xác định đó thay thế?
Một hệ thống được kiến trúc tốt có thể quản lý tính chất xác suất của LLM thông qua các lớp xác thực, chấm điểm độ tin cậy và hàng đợi xem xét của con người. Điều đó là đúng. Nhưng những lớp này có cái giá — về thời gian phát triển, bảo trì và sự giám sát của con người cần thiết để bắt lỗi mà mô hình mắc phải. Chi phí này hiếm khi xuất hiện trong hồ sơ kinh doanh. Nó xuất hiện sau này, ở những người thực hiện công việc mà quá trình tự động hóa lẽ ra phải loại bỏ.
Điều mà LLM thực sự làm tốt
Điều này dẫn tôi đến những gì LLM thực sự làm tốt:
- Dân chủ hóa phát triển phần mềm — loại bỏ rào cản kỹ thuật trong khi con người vẫn định hướng.
- Tăng tốc độ học tập — loại bỏ rào cản tiếp cận trong khi con người vẫn tổng hợp kiến thức.
- Hỗ trợ diễn giải — giảm tải nhận thức trong khi con người vẫn đưa ra quyết định.
- Công việc ngôn ngữ và dịch thuật — loại bỏ ma sát trong khi con người vẫn nắm giữ ý nghĩa.
Bạn hãy nhận ra quy luật. Trong mọi trường hợp, con người vẫn là yếu tố thiết yếu. LLM là công cụ khuếch đại: chúng tăng tốc và mở rộng quy mô những gì chúng ta muốn làm, và cả những sai lầm của chúng ta.
Cờ Quốc tế của Trái Đất
Sự thay đổi trong câu chuyện về AI
Hoạt động tiếp thị tiêu dùng xung quanh Trí tuệ Nhân tạo Tổng quát (AGI) đã trở nên im lặng. Các phòng thí nghiệm bản thân họ vẫn tập trung vào AGI hơn bao giờ hết, vì đó nằm trong sứ mệnh và chương trình nghị sự nghiên cứu đã nêu của họ. Nhưng câu chuyện của công chúng đã chuyển hướng sang các tính năng thực dụng và các gói thuê bao hàng tháng.
Quyết định của Apple tập trung vào AI thực dụng và nội bộ (local) cho người dùng thay vì chạy theo các điểm chuẩn của mô hình tiên phong là rất đáng nói. Nó gợi ý rằng cuộc đua towards trí tuệ nhân tạo tổng quát có thể ít quan trọng hơn đối với giá trị thực tế so với những gì ngành công nghiệp đang tuyên bố.
Điều này khiến tôi nghi ngờ rằng OpenAI, Google và Anthropic đang làm việc trên các mô hình rất khác nhau sau những cánh cửa đóng kín, những thí nghiệm mà chúng ta chưa biết đến, bởi vì cách tiếp cận LLM hiện tại có một trần giới hạn, và họ biết điều đó.
Chủ quyền công nghệ và an ninh quốc gia
Tôi thấy đặc biệt đáng lo ngại khi nghe mọi người định khung AI như một vấn đề an ninh quốc gia. Cách định khung đó không tạo ra sự khôn ngoan; nó tạo ra sự leo thang. Mọi công nghệ lớn của thế kỷ trước bị hấp thụ vào câu chuyện về quyền lực và sự thống trị cuối cùng đều tạo ra xung đột thay vì tiến bộ. Các quốc gia và khối khác sẽ không thụ động đứng nhìn. Họ sẽ xây dựng các giải pháp thay thế, hạn chế quyền truy cập và trả đũa thông qua các quy định và đầu tư cạnh tranh. Cách định khung cuộc đua vũ trang làm phân mảnh công nghệ thay vì phát triển nó.
Apple, thú vị thay, cung cấp một ví dụ phản bác một phần: Một nước đi chủ quyền thương mại không yêu cầu vũ khí hóa công nghệ để bắt lấy giá trị của nó.
Tôi không nói là AI đã hết thời. Tôi đang nói LLM đang đụng trần. Mô hình kinh doanh LLM đang chịu áp lực, không phải vì công nghệ đã ngừng cải tiến, mà vì chi phí để tiếp cận sự cải tiến đó tiếp tục tăng lên trong khi các trường hợp sử dụng bền vững đối với hầu hết các doanh nghiệp và chuyên gia độc lập vẫn hẹp hơn so với quảng cáo.
Tôi không muốn bị phân tâm bởi hàng loạt thông báo về tính năng mới; đó là những chiến thuật thao túng tốt. Sự thật sẽ tự bộc lộ rõ ràng hơn khi bạn nhìn vào các mô hình thuê bao và giá tín dụng ngày càng tăng.
Là một người chấp nhận sớm AI, tôi viết bài này như một lời cảnh báo cho chính mình: Hãy nhớ nhìn sâu hơn, có cái nhìn tốt hơn và quyết định hướng đi nào. Có thể có vàng ở nơi nào đó khác...


