Vận hành AI trong khu vực công: Tại sao các mô hình ngôn ngữ nhỏ lại là giải pháp tối ưu?

Các tổ chức chính phủ đang chịu áp lực thúc đẩy ứng dụng AI nhưng đối mặt với nhiều rào cản về bảo mật và hạ tầng. Các mô hình ngôn ngữ nhỏ (SLM) chuyên dụng nổi lên như một giải pháp hứa hẹn, cho phép xử lý dữ liệu cục bộ an toàn, tiết kiệm chi phí và giảm thiểu sự phụ thuộc vào hạ tầng điện toán đám mây.

Sự bùng nổ của trí tuệ nhân tạo (AI) đang lan rộng khắp các ngành công nghiệp, đặt các tổ chức khu vực công trước áp lực phải tăng tốc độ ứng dụng công nghệ này. Tuy nhiên, các cơ quan nhà nước phải đối mặt với những rào cản riêng biệt về bảo mật, quản trị và vận hành, khác biệt hoàn toàn so với các doanh nghiệp tư nhân. Chính vì vậy, các mô hình ngôn ngữ nhỏ (Small Language Models - SLMs) được thiết kế riêng biệt đang mở ra một triển vọng hứa hẹn để đưa AI vào vận hành thực tế trong môi trường này.

Mô hình ngôn ngữ nhỏ đang trở thành giải pháp tối ưu cho khu vực công

Một nghiên cứu của Capgemini chỉ ra rằng 79% các giám đốc điều hành trong khu vực công trên toàn cầu lo ngại về vấn đề bảo mật dữ liệu của AI. Đây là một con số dễ hiểu khi xét đến tính nhạy cảm cao của dữ liệu chính phủ và các nghĩa vụ pháp lý xung quanh việc sử dụng dữ liệu đó. Ông Han Xiao, Phó chủ tịch mảng AI tại Elastic, nhận định: "Các cơ quan chính phủ phải cực kỳ hạn chế loại dữ liệu mà họ gửi ra mạng lưới. Điều này đặt ra nhiều ranh giới trong cách họ suy nghĩ và quản lý dữ liệu."

Những thách thức vận hành độc đáo

Khi các đơn vị tư nhân mở rộng quy mô AI, họ thường giả định rằng một số điều kiện nhất định sẽ được đáp ứng, bao gồm kết nối đám mây liên tục, dựa vào hạ tầng tập trung, chấp nhận tính minh bạch không hoàn toàn của mô hình và ít hạn chế trong việc di chuyển dữ liệu. Tuy nhiên, đối với nhiều cơ quan nhà nước, việc chấp nhận các điều kiện này có thể từ nguy hiểm đến không thể thực hiện được.

Các cơ quan chính phủ phải đảm bảo dữ liệu nằm dưới sự kiểm soát của họ, thông tin có thể được kiểm tra và xác minh, đồng thời gián đoạn vận hành phải được giữ ở mức tối thiểu. Đồng thời, họ thường phải vận hành hệ thống trong môi trường mà kết nối internet bị hạn chế, không ổn định hoặc không có sẵn. Những phức tạp này ngăn cản nhiều dự án thí điểm AI đầy triển vọng trong khu vực công vượt qua giai đoạn thử nghiệm. Một cuộc khảo sát của Elastic cho thấy 65% các nhà lãnh đạo khu vực công gặp khó khăn trong việc sử dụng dữ liệu liên tục theo thời gian thực và ở quy mô lớn.

Hạ tầng và bảo mật là những rào cản lớn nhất đối với AI trong khu vực công

Các rào cản về hạ tầng càng làm trầm trọng thêm vấn đề. Các tổ chức chính phủ cũng có thể gặp khó khăn trong việc có được các bộ vi xử lý đồ họa (GPU) dùng để huấn luyện và truy cập các mô hình AI phức tạp. Ông Xiao chỉ ra: "Chính phủ thường không mua GPU như khu vực tư nhân - họ không quen với việc quản lý hạ tầng GPU. Vì vậy, việc tiếp cận GPU để chạy mô hình là một nút thắt cổ chai đối với phần lớn khu vực công."

Một mô hình nhỏ gọn và thực tế hơn

Các yêu cầu không thể thương lượng trong khu vực công khiến các mô hình ngôn ngữ lớn (LLMs) trở nên không khả thi. Ngược lại, các SLM có thể được lưu trữ cục bộ (on-premise), mang lại mức độ bảo mật và kiểm soát cao hơn. SLM là các mô hình AI chuyên biệt thường sử dụng hàng tỷ tham số thay vì hàng trăm tỷ tham số như LLM, giúp chúng ít đòi hỏi sức mạnh tính toán hơn nhiều so với các mô hình lớn nhất.

Khu vực công không cần phải xây dựng các mô hình ngày càng lớn nằm ở các địa điểm tập trung từ xa. Một nghiên cứu thực nghiệm đã phát hiện ra rằng SLM hoạt động tốt hơn hoặc tương đương với LLM. SLM cho phép sử dụng thông tin nhạy cảm một cách hiệu quả và hiệu quả trong khi tránh được sự phức tạp vận hành của việc duy trì các mô hình lớn. Ông Xiao nhận định: "Rất dễ sử dụng ChatGPT để kiểm tra chính tả. Nhưng việc tự vận hành các mô hình ngôn ngữ lớn (LLM) của riêng bạn một cách trơn tru trong môi trường không có kết nối mạng là rất khó khăn."

SLM được xây dựng chuyên biệt cho nhu cầu của phòng ban hoặc cơ quan sẽ sử dụng chúng. Dữ liệu được lưu trữ an toàn bên ngoài mô hình và chỉ được truy cập khi có yêu cầu truy vấn. Các lệnh (prompts) được thiết kế kỹ lưỡng đảm bảo chỉ những thông tin phù hợp nhất được truy xuất, mang lại câu trả lời chính xác hơn. Bằng cách sử dụng các phương pháp như truy xuất thông minh, tìm kiếm vector và neo nguồn có thể xác minh, các hệ thống AI có thể được xây dựng để phục vụ nhu cầu của khu vực công.

Do đó, giai đoạn tiếp theo của việc ứng dụng AI trong khu vực công có thể là đưa công cụ AI đến nơi dữ liệu, thay vì gửi dữ liệu ra khỏi đám mây. Gartner dự đoán rằng đến năm 2027, các mô hình AI nhỏ và chuyên biệt sẽ được sử dụng nhiều gấp ba lần so với LLM.

Năng lực tìm kiếm vượt trội

"Khi mọi người trong khu vực công nghe về AI, họ có thể sẽ nghĩ đến ChatGPT. Nhưng chúng ta có thể tham vọng hơn nhiều", ông Xiao nói. "AI có thể cách mạng hóa cách chính phủ tìm kiếm và quản lý khối lượng dữ liệu khổng lồ mà họ sở hữu."

Bên cạnh các chatbot, AI revealed ra một trong những cơ hội gần gũi nhất: cải tiến tìm kiếm một cách ngoạn mục. Giống như nhiều tổ chức khác, khu vực công có những "núi" dữ liệu phi cấu trúc - bao gồm báo cáo kỹ thuật, tài liệu mua sắm, biên bản cuộc họp và hóa đơn. Ngày nay, AI có thể cung cấp kết quả từ nguồn hỗn hợp như PDF có thể đọc được, bản quét, hình ảnh, bảng tính và bản ghi âm, cũng như bằng nhiều ngôn ngữ. Tất cả những điều này có thể được lập chỉ mục bởi các hệ thống chạy bằng SLM để cung cấp câu trả lời tùy chỉnh và soạn thảo các văn bản phức tạp bằng bất kỳ ngôn ngữ nào, đồng thời đảm bảo đầu ra tuân thủ pháp lý.

"Cơ quan công có nhiều dữ liệu, nhưng họ không luôn biết cách sử dụng dữ liệu này. Họ không biết những khả năng là gì", ông Xiao chia sẻ.

Hơn nữa, AI có thể giúp nhân viên chính phủ diễn giải dữ liệu họ truy cập. "AI ngày nay có thể cung cấp cho bạn một góc nhìn hoàn toàn mới về cách khai thác dữ liệu đó", ông Xiao nói. Một SLM được đào tạo tốt có thể diễn giải các quy chuẩn pháp lý, trích xuất thông tin chi tiết từ các cuộc tham vấn công khai, hỗ trợ việc ra quyết định điều hành dựa trên dữ liệu và cải thiện khả năng tiếp cận của người dân đối với các dịch vụ và thông tin hành chính.

Lời hứa của các mô hình ngôn ngữ nhỏ

Tập trung vào SLM chuyển đổi cuộc trò chuyện từ việc mô hình toàn diện đến mức nào sang mức độ hiệu quả của nó. LLMs gây ra chi phí hiệu suất và tính toán đáng kể và yêu cầu phần cứng chuyên dụng mà nhiều thực thể công không thể chi trả. Mặc dù yêu cầu một số chi phí vốn, SLM ít tốn kém tài nguyên hơn LLM, do đó chúng có xu hướng rẻ hơn và giảm tác động môi trường.

Các cơ quan trong khu vực công thường phải đối mặt với các yêu cầu kiểm toán nghiêm ngặt, và các thuật toán SLM có thể được tài liệu化和 chứng minh là minh bạch. Một số quốc gia, đặc biệt là ở Châu Âu, cũng có các quy định về quyền riêng tư như GDPR mà các SLM có thể được thiết kế để đáp ứng.

Dữ liệu đào tạo được tùy chỉnh tạo ra kết quả tập trung hơn, giảm thiểu lỗi, thiên kiến và ảo giác mà AI thường mắc phải. Như ông Xiao nói: "Các mô hình ngôn ngữ lớn tạo ra văn bản dựa trên những gì chúng được đào tạo, do đó có một ngày cắt đứt khi quá trình đào tạo kết thúc. Nếu bạn hỏi về bất kỳ điều gì sau ngày đó, nó sẽ ảo giác. Chúng ta có thể giải quyết điều này bằng cách buộc mô hình hoạt động từ các nguồn đã được xác minh."

Rủi ro cũng được giảm thiểu tối đa bằng cách giữ dữ liệu trên máy chủ cục bộ, hoặc thậm chí trên một thiết bị cụ thể. Điều này không phải là sự cô lập mà là sự tự chủ chiến lược để cho phép sự tin cậy, khả năng phục hồi và sự phù hợp.

Bằng cách ưu tiên các mô hình cụ thể theo nhiệm vụ được thiết kế cho các môi trường xử lý dữ liệu cục bộ, và bằng cách liên tục giám sát hiệu suất và tác động, các tổ chức khu vực công có thể xây dựng các khả năng AI bền vững hỗ trợ quyết định trong thế giới thực. "Đừng bắt đầu bằng một chatbot; hãy bắt đầu bằng tìm kiếm", ông Xiao khuyên. "Rất nhiều thứ mà chúng ta coi là trí thông minh của AI thực sự là về việc tìm thấy đúng thông tin."