Ghost Pepper: Ứng dụng chuyển đổi giọng nói thành văn bản 100% ngoại tuyến cho macOS
Ghost Pepper là ứng dụng macOS cho phép chuyển đổi giọng nói thành văn bản hoàn toàn cục bộ, đảm bảo không có dữ liệu nào rời khỏi máy tính. Sử dụng các mô hình AI WhisperKit và Qwen chạy trên chip Apple Silicon, công cụ này hỗ trợ viết mã và email một cách riêng tư với giấy phép mã nguồn mở MIT.

Ghost Pepper: Ứng dụng chuyển đổi giọng nói thành văn bản 100% ngoại tuyến cho macOS
Ghost Pepper là một ứng dụng mới dành cho macOS tập trung vào quyền riêng tư, cho phép chuyển đổi giọng nói thành văn bản (speech-to-text) hoàn toàn cục bộ. Được xây dựng với mục đích không để bất kỳ dữ liệu người dùng nào rời khỏi máy tính, ứng dụng này đặc biệt hữu ích cho các lập trình viên và những người thường xuyên phải soạn thảo email.
Điểm nổi bật nhất của Ghost Pepper là cơ chế "nhấn giữ để nói" (hold-to-talk). Người dùng chỉ cần nhấn phím Control để ghi âm và thả ra để ứng dụng tự động chuyển đổi và dán văn bản vào bất kỳ trường nhập liệu nào.
Tính năng chính
- Nhấn Control để nói: Chỉ cần giữ phím Control để ghi âm và thả ra để văn bản được chuyển đổi và dán tự động.
- Chạy hoàn toàn cục bộ: Các mô hình AI chạy trực tiếp trên chip Apple Silicon, không sử dụng API đám mây nào, đảm bảo dữ liệu không bị gửi đi ngoài.
- Dọn dẹp thông minh: Sử dụng mô hình ngôn ngữ cục bộ (LLM) để loại bỏ các từ thừa (filler words) và tự động sửa lỗi tự sửa trong câu nói.
- Tiện ích Menu bar: Ứng dụng ẩn mình trong thanh menu, không có biểu tượng trên Dock và có thể tự động khởi động khi đăng nhập.
- Tùy biến cao: Cho phép chỉnh sửa câu lệnh dọn dẹp, chọn micro và bật/tắt các tính năng theo ý muốn.
Công nghệ và Mô hình AI
Ghost Pepper sử dụng sự kết hợp của hai mô hình mã nguồn mở mạnh mẽ, được tải xuống tự động trong lần chạy đầu tiên và lưu trữ trong bộ nhớ đệm cục bộ:
- WhisperKit (small.en): Khoảng 466 MB. Đây là mô hình chịu trách nhiệm chuyển đổi giọng nói thành văn bản thô.
- Qwen 2.5 (1.5B hoặc 3B): Khoảng 3 GB. Mô hình LLM này đóng vai trò xử lý văn bản, loại bỏ các từ đệm như "ừm", "à" và chỉnh sửa lại câu cho mạch lạc.
Cả hai mô hình đều được phục vụ thông qua Hugging Face và hoạt động mượt mà nhờ sức mạnh của phần cứng Apple.
Cách cài đặt và sử dụng
Để sử dụng Ghost Pepper, máy tính của bạn cần chạy macOS 14.0 trở lên và sử dụng chip Apple Silicon (M1 trở lên).
Quy trình cài đặt rất đơn giản:
- Tải file
GhostPepper.dmgtừ bản phát hành mới nhất. - Mở file DMG và kéo ứng dụng vào thư mục Applications.
- Cấp quyền truy cập Microphone và Accessibility (Khả năng truy cập) khi được nhắc.
- Quyền Microphone: Để ghi âm giọng nói của bạn.
- Quyền Accessibility: Để sử dụng phím tắt toàn cục và mô phỏng thao tác dán văn bản.
Sau khi cài đặt, bạn chỉ cần nhấn giữ Control và bắt đầu nói. Ứng dụng sẽ tự động xử lý và chèn văn bản vào nơi con trỏ đang hoạt động.
Quyền riêng tư và Doanh nghiệp
Ghost Pepper được thiết kế với tiêu chí bảo mật tối đa. Ứng dụng không ghi log bất kỳ nội dung nào vào ổ cứng; các bản chuyển đổi chỉ tồn tại trong bộ nhớ tạm và biến mất khi ứng dụng đóng. Các log gỡ lỗi cũng chỉ được lưu trong bộ nhớ (in-memory).
Đối với các thiết bị được quản lý bởi doanh nghiệp (managed devices), việc cấp quyền Accessibility thường yêu cầu quyền quản trị. Các quản trị viên IT có thể phê duyệt trước thông qua hồ sơ MDM (Jamf, Kandji, Mosaic, v.v.) bằng cách sử dụng payload PPPC (Privacy Preferences Policy Control) với Bundle ID là com.github.matthartman.ghostpepper.
Ứng dụng được phát hành dưới giấy phép MIT, hoàn toàn miễn phí và mã nguồn mở. Tên gọi "Ghost Pepper" (Ớt Ghost) vừa ám chỉ sự "cay nồng" khi cung cấp tính năng miễn phí mà các startup khác đã huy động tới 80 triệu USD để xây dựng, vừa thể hiện cam kết về sự riêng tư (như một "bóng ma" không để lại dấu vết dữ liệu).



