Gemini của Google giờ đây có thể chạy trên server riêng biệt, ngắt mạng hoàn toàn: Rút nguồn là model "biến mất"

22 tháng 4, 2026·10 phút đọc

Cirrascale hợp tác với Google để cung cấp mô hình AI Gemini dưới dạng thiết bị vật lý tại chỗ (on-prem), giúp các tổ chức tài chính và chính phủ sử dụng AI tiên tiến mà không cần kết nối internet. Giải pháp này đảm bảo bảo mật tuyệt đối với cơ chế tính toán bảo mật và khả năng tự hủy dữ liệu ngay lập tức.

Gemini của Google giờ đây có thể chạy trên server riêng biệt, ngắt mạng hoàn toàn: Rút nguồn là model "biến mất"

Gemini của Google giờ đây có thể chạy trên server riêng biệt, ngắt mạng hoàn toàn: Rút nguồn là model "biến mất"

Hôm nay, Cirrascale Cloud Services đã công bố mở rộng hợp tác với Google Cloud để đưa mô hình Gemini hoạt động tại chỗ (on-premises) thông qua Google Distributed Cloud. Điều này biến Cirrascale thành nhà cung cấp "neocloud" đầu tiên cung cấp mô hình AI tiên tiến nhất của Google dưới dạng một thiết bị riêng tư, hoàn toàn ngắt kết nối. Thông báo này, được đưa ra nhân sự kiện Google Cloud Next 2026 tại Las Vegas, giải quyết một bài toán nan giải đã ám ảnh các ngành công nghiệp được kiểm soát từ khi bùng nổ generative AI: làm thế nào để tiếp cận các mô hình AI hàng đầu mà không phải giao quyền kiểm soát dữ liệu.

Giải pháp mới này đóng gói Gemini vào một thiết bị phần cứng do Dell sản xuất, được Google chứng nhận và trang bị 8 GPU Nvidia, được bao bọc bởi các lớp bảo vệ tính toán bảo mật (confidential computing). Các doanh nghiệp và cơ quan chính phủ có thể triển khai hệ thống này ngay trong trung tâm dữ liệu của Cirrascale hoặc cơ sở vật lý của chính họ, hoàn toàn ngắt kết nối với internet và hạ tầng đám mây của Google. Sản phẩm bước vào giai đoạn dùng thử ngay lập tức và dự kiến có mặt rộng rãi vào tháng 6 hoặc tháng 7 tới.

Trong một cuộc phỏng vấn độc quyền với VentureBeat, Dave Driggers, CEO của Cirrascale Cloud Services, đã mô tả việc triển khai này là "bước tiếp theo của hợp tác" và "có khả năng cung cấp mô hình quan trọng nhất của họ, đó là Gemini". Ông nhấn mạnh những gì khách hàng sẽ nhận được: "Đó là Gemini đầy đủ. Nó không bị cắt giảm, không có gì bị thiếu sót, và nó sẽ có sẵn trong một kịch bản riêng tư để chúng tôi có thể đảm bảo cho họ rằng dữ liệu, đầu vào và đầu ra của họ đều an toàn".

Động thái này đánh dấu sự chuyển dịch sâu sắc trong thị trường AI doanh nghiệp, nơi các mô hình mạnh mẽ nhất đang di chuyển khỏi các trung tâm dữ liệu của các nhà cung cấp đám mây khổng lồ (hyperscalers) và vào hệ thống máy chủ của riêng khách hàng — một sự đảo ngược của giáo điều điện toán đám mây đã định hình thập kỷ qua.

Sự đánh đổi khó khăn khiến ngân hàng và chính phủ đứng ngoài cuộc AI

Trong nhiều năm, các tổ chức trong lĩnh vực tài chính, y tế, quốc phòng và chính phủ đối mặt với một lựa chọn二元: hoặc là tiếp cận các mô hình AI mạnh mẽ nhất thông qua API đám mây công cộng (đồng nghĩa với việc để lộ dữ liệu nhạy cảm cho hạ tầng của bên thứ ba), hoặc là chấp nhận các mô hình mã nguồn mở kém khả năng hơn mà họ có thể tự lưu trữ. Đề xuất mới của Cirrascale cố gắng loại bỏ hoàn toàn sự đánh đổi này.

Ông Driggers mô tả cách vấn đề niềm tin leo thang theo từng giai đoạn. Đầu tiên, các công ty lo lắng về việc giao dữ liệu độc quyền cho các ông lớn đám mây. Sau đó đến sự nhận thức sâu sắc hơn. "Họ bắt đầu nhận ra, chà ơi, khi người dùng nhập dữ liệu, họ đang đưa thông tin riêng tư đi — và cả đầu ra cũng là riêng tư," ông Driggers nói. "Và sau đó các nhà cung cấp đám mây nói: 'Các câu lệnh và phản hồi của bạn? Đó là của chúng tôi. Chúng tôi cần chúng để trả lời câu hỏi của bạn'. Đó là lúc nhu cầu về AI hoàn toàn riêng tư trở nên không thể bỏ qua".

Khác với Google Distributed Cloud mà Google đang cung cấp dưới dạng tiện ích mở rộng đám mây tại chỗ, việc triển khai của Cirrascale đặt mô hình thực tế — bao gồm cả các trọng số (weights) — hoàn toàn bên ngoài hạ tầng của Google. "Google không sở hữu phần cứng này. Chúng tôi sở hữu phần cứng, hoặc khách hàng sở hữu phần cứng," ông Driggers khẳng định. "Nó hoàn toàn nằm ngoài Google".

Khi được hỏi về việc triển khai tại chỗ với các mô hình OpenAI của Microsoft Azure hay AWS Outposts, ông Driggers phân biệt rất rõ ràng: "Những thứ đó khá khác biệt. Đây là mô hình thực tế được triển khai tại chỗ bên ngoài đám mây của họ. Không phải là phiên bản cắt giảm. Đó là mô hình gốc".

Rút phích cắm và model biến mất: Cách tính toán bảo mật bảo vệ "ngọc quý" của Google

Các nền tảng kỹ thuật của việc triển khai này cho thấy Google và Cirrascale nghiêm trọng đến mức nào với câu hỏi bảo mật. Mô hình Gemini hoàn toàn nằm trong bộ nhớ dễ mất (volatile memory) — không phải trên bộ nhớ lưu trữ persists. "Ngay khi ngắt nguồn điện, mô hình sẽ biến mất," ông Driggers giải thích. Các phiên làm việc của người dùng hoạt động qua bộ đệm cache sẽ tự động xóa khi phiên kết thúc. "Đầu vào của người dùng công ty, một khi phiên đó kết thúc, chúng sẽ biến mất. Chúng có thể được lưu lại, nhưng theo mặc định là chúng sẽ mất đi có thể nói là tính năng bảo mật ấn tượng nhất là điều sẽ xảy ra khi ai đó cố gắng can thiệp vào thiết bị này. Ông Driggers mô tả một cơ chế khiến máy trở nên vô dụng: "Bạn làm bất cứ điều gì đi ngược lại tính toán bảo mật, và nó sẽ biến mất. Không chỉ máy tắt nguồn và do đó mô hình biến mất, mà nó thực sự đặt một đánh dấu cho biết: 'Bạn đã vi phạm tính toán bảo mật'. Máy đó phải được gửi lại cho chúng tôi, hoặc về Dell hoặc về Google". Ông ví thiết bị này như một thứ "tự hủy như quả bom hẹn giờ nếu có sự cố".

Mức độ bảo vệ này phản ánh sự lo lắng của chính Google khi việc tung ra các trọng số của mô hình cờ bạc vào các môi trường họ không kiểm soát. Thiết bị này thực chất là một chiếc két sắt: mô hình chạy bên trong nó, nhưng không ai — thậm chí cả khách hàng — có thể trích xuất hoặc kiểm tra các trọng số. Vỏ bọc tính toán bảo mật đảm bảo rằng việc sở hữu vật lý phần cứng không cấp quyền truy cập vào sở hữu trí tuệ của mô hình.

Khi Google phát hành phiên bản mới của Gemini, thiết bị cần kết nối lại — nhưng chỉ trong thời gian ngắn và qua kênh riêng tư. "Nó cần phải kết nối lại với Google để tải mô hình mới. Nhưng điều đó có thể thực hiện qua kết nối riêng tư," ông nói. Đối với những khách hàng nhạy cảm về bảo mật nhất không bao giờ cho phép máy kết nối với mạng bên ngoài, Cirrascale cung cấp giải pháp thay đổi vật lý: "Máy chủ sẽ được rút phích cắm, xóa sạch, đảm bảo mọi dữ liệu đã biến mất, một máy chủ mới với phiên bản mô hình mới sẽ được giao đến".

Từ Phố Wall đến phòng thí nghiệm thuốc, cơn khát AI "air-gapped" đang tăng tốc

Ông Driggers xác định ba động lực chính của nhu cầu: sự tin cậy, an ninh và hiệu suất đảm bảo. Các tổ chức dịch vụ tài chính đứng đầu danh sách. "Họ có các vấn đề về quy định nơi họ không thể có thứ gì đó nằm ngoài tầm kiểm soát. Họ phải là người xác định vị trí của mọi thứ. Nó phải được ngắt mạng hoàn toàn (air gap)," ông nói. Quy mô triển khai tối thiểu — một máy chủ đơn với 8 GPU — làm cho sản phẩm trở nên dễ tiếp cận hơn so với các dịch vụ riêng tư của chính Google.

Ngoài tài chính, ông Driggers chỉ ra việc phát hiện thuốc, dữ liệu y tế, nghiên cứu khu vực công và bất kỳ doanh nghiệp nào xử lý thông tin cá nhân. Ông cũng nhấn mạnh một trường hợp sử dụng ngày càng quan trọng: chủ quyền dữ liệu. "Làm thế nào với doanh nghiệp của bạn làm kinh doanh bên ngoài Hoa Kỳ, và giờ bạn có các luật về chủ quyền dữ liệu ở những nơi chưa có Google Cloud (GCP)? Chúng tôi có thể cung cấp Gemini riêng tư tại các quốc gia nhỏ hơn nơi dữ liệu không được phép rời đi.

Phần công cộng là một mục tiêu lớn khác. Vào tháng 3, Cirrascale đã ra mắt một bộ phận Dịch vụ Chính phủ chuyên biệt như một phần của hợp tác trước đó với Google Public Sector quanh sáng kiến GPAR. Sự kiện hôm nay mở rộng mối quan hệ đó từ công cụ nghiên cứu sang chính mô hình AI.

Cam kết về hiệu suất là trụ cột thứ ba. Ông Driggers lưu ý rằng các mô hình hàng đầu được tiếp cận thông qua API công cộng mang lại thời gian phản hồi không nhất quán — một vấn đề cho các ứng dụng kinh doanh quan trọng. Việc triển khai riêng tư loại bỏ sự biến thiên này.

Giấy phép, tính phí token và mô hình định giá linh hoạt

Mô hình định giá phản ánh triết lý rộng hơn của Cirrascale là đáp ứng khách hàng ở bất cứ đâu. Ông Driggers mô tả một số tùy chọn tiêu dùng: cấp phép dựa trên người dùng (cả cấp doanh nghiệp và tiêu chuẩn), tính phí theo token, và định giá cố định "all-you-can-eat" (không giới hạn) cho mỗi thiết bị. Cam kết tối thiểu là một máy chủ chuyên dụng — các thiết bị không được chia sẻ giữa khách hàng trong bất kỳ cấu hình nào.

Khách hàng cũng có thể chọn mua phần cứng trực tiếp trong khi vẫn tiêu thụ Gemini như một dịch vụ được quản lý. Mô hình sở hữu linh hoạt này đặc biệt phù hợp với các trường đại học và viện nghiên cứu được chính phủ tài trợ.

Kỷ nguyên AI riêng tư đang đến nhanh hơn bất kỳ ai dự kiến

Sự hợp tác Gemini là động thái nổi tiếng nhất cho đến nay — và nó tận dụng một xu hướng ngành rộng hơn. Việc đẩy AI tiên tiến ra khỏi đám mây công cộng và vào hạ tầng riêng tư không còn là một nhu cầu ngách. Các nhà phân tích ngành dự đoán rằng đến năm 2027, 40% việc đào tạo và suy luận (inference) mô hình AI sẽ diễn ra bên ngoài môi trường đám mây công cộng.

Đối với Google, việc cho phép mô hình ngọc quý chạy trên phần cứng do bên thứ ba sở hữu là một bước đi táo bạo. Nhưng lựa chọn thay thế — chứng kiến các doanh nghiệp được điều chỉnh chuyển sang các mô hình mã nguồn mở hoặc Azure OpenAI Service của Microsoft — rõ ràng là một kết quả tồi tệ hơn.

Đối với các tập đoàn lớn nhất thế giới, cuộc cách mạng AI trong ba năm qua được định nghĩa bởi một sự đánh đổi đơn giản: gửi dữ liệu của bạn lên đám mây và nhận lại trí thông minh. Cá cược của Cirrascale — và ngày càng nhiều của Google — là những khách hàng lớn nhất đã chán ngán với các điều khoản đó. AI mạnh mẽ nhất hành tinh hiện có sẵn trong một chiếc hộp khóa đơn lẻ có thể nằm trong két ngân hàng, hầm trường đại học, hoặc cơ sở chính phủ ở một quốc gia nơi Google không có trung tâm dữ liệu. Đám mây, hóa ra, cuối cùng đã sẵn sàng để hạ cánh xuống trái đất.

Bài viết được tổng hợp và biên soạn bằng AI từ các nguồn tin tức công nghệ. Nội dung mang tính tham khảo. Xem bài gốc ↗