ChatGPT chơi game bắn súng 8-bit trên máy tính cổ Commander X16
Một nhà phát triển đã kết nối API ChatGPT với tựa game bắn súng 8-bit PvP-AI chạy trên giả lập Commander X16. Thay vì xử lý hình ảnh hay âm thanh, AI sử dụng dữ liệu văn bản có cấu trúc gọi là "cảm giác thông minh" để suy luận chiến lược và thậm chí tìm ra lỗi trong game.
PvP-AI là bản tái hiện của một tựa game 8-bit mà tôi từng viết vào năm 1990. Khi đó, chỉ còn lại vài bản vẽ và ghi chú tay là bằng chứng duy nhất về sự tồn tại của nó. Vào những năm đầu thập niên 90, việc viết code cho nền tảng 8-bit đòi hỏi phải tận dụng tối đa mọi bit bộ nhớ và sức mạnh xử lý CPU chỉ để đạt được tốc độ 4 khung hình/giây (fps) với những hoạt ảnh và nền đơn giản nhất. Tuy nhiên, khi tôi hoàn thành nó, cuộc suy thoái kinh tế năm 1990 đã bắt đầu, ảnh hưởng đến nhiều ngành công nghiệp, bao gồm cả máy tính cá nhân, nên dự án này không bao giờ được ra mắt.
Vài năm trước, kênh YouTube của David Murray (The8BitGuy) đã thu hút sự chú ý của tôi, đặc biệt là chiếc máy tính cổ Commander X16 của ông. Khi xem xét các thông số kỹ thuật, tôi nhận ra rằng nó có khả năng xử lý phiên bản mới hơn của PvP-AI.
Thực tế cho thấy trình giả lập (emulator) đã xử lý trò chơi rất tốt, chạy ở tốc độ gần 8.6 fps với nhiều chi tiết hơn và AI tốt hơn! Đây là video minh họa cho quá trình hoạt động. Tuy nhiên, đối với phần cứng thực tế, hóa lại có một vấn đề về vẽ đường thẳng trong module VERA khiến một số loại đường không được hiển thị đúng, buộc phải sử dụng phương pháp chậm hơn. Kết quả cuối cùng là trên phần cứng thực, game chỉ chạy được 4 fps.
Nếu bạn muốn thử nghiệm, bạn có thể tải xuống các tệp từ Google Drive của tôi. Tôi khuyên dùng trình giả lập x16-emulator, cụ thể là bản R49, để chạy nó. Bạn có thể tìm thêm chi tiết trong kho lưu trữ GitHub EXPLORE của tôi dưới mục CX16 v2 – AI Demo (tức là PvP-AI).
Điều đáng chú ý là một số đặc thù trong lối chơi, giúp phân biệt nó với những tựa game "bắn súng" (shoot-'em-up) 8-bit điển hình:
Hóa ra tựa game này rất phù hợp với các "chiến lược thay thế" mà ta có thể gặp phải khi tích hợp với AI — và điều này dẫn chúng ta đến...
Được truyền cảm hứng bởi những nỗ lực khác nhằm để các LLM (Mô hình ngôn ngữ lớn) tương tác với hệ thống 8-bit, nổi bật nhất là ChatGPT đấu với Video Chess trên Atari 2600, tôi muốn khám phá xem điều gì là cần thiết để một LLM có thể tương tác thành công với một trò chơi đơn giản.
Khác với các phương pháp yêu cầu LLM phải giải thích trực tiếp đầu ra hình ảnh hoặc âm thanh, phương pháp của tôi sử dụng cái tôi gọi là "cảm giác thông minh" (smart senses). Đây là các biểu diễn dạng văn bản có cấu trúc về thế giới game, giúp trừu tượng hóa các nhiệm vụ nhận thức nặng nề. Điều này cho phép LLM dành ít thời gian hơn để giải mã dữ liệu thô và tập trung vào những gì nó làm tốt nhất: suy luận về trạng thái và lập kế hoạch cho hành động.
Vì vậy, những điều sau đây đã được thực hiện để làm cho trò chơi tương thích với LLM:
Giống như các nhà nghiên cứu khác, tôi đang sử dụng API ChatGPT (mô hình gpt-4o) làm LLM vì nó cung cấp khả năng suy luận mạnh mẽ, đầu ra có cấu trúc ổn định và giá cả phải chăng cho mỗi lần gọi. Tôi cũng quen thuộc nhất với PHP, nên tôi sử dụng nó làm lớp giao diện kết nối LLM với trò chơi. Mảnh ghép cuối cùng còn thiếu là kích hoạt giao tiếp hai chiều giữa PHP và trình giả lập:
Sau một số điều tra vào các khả năng hiện có của trình giả lập, tôi đã có thể tận dụng một tính năng mới, hiện đang là pull request đang được xem xét, và điều đó đã hoàn thành "chuỗi" kết nối:
Sau khi kích hoạt khả năng chụp màn hình theo yêu cầu và loại bỏ âm thanh cũng như các yếu tố không cần thiết khác, tôi đã có một nền tảng hoạt động để nghiên cứu. Và một sự cho phép cuối cùng vì lý do ngân sách: thay vì thực hiện cuộc gọi API ở mỗi khung hình, tôi chọn thực hiện nó ở mỗi khung hình xen kẽ.
Trong quá trình điều tra, tôi đã ghi lại một loạt ba trò chơi liên tiếp "ChatGPT vs PvP-AI" với các ghi chú liên tục từ game này sang game khác. Chúng cung cấp một diễn biến rất thú vị từ việc thử nghiệm đến việc tìm ra chiến lược chiến thắng bởi LLM.
Bạn có thể tìm thêm chi tiết về giao diện LLM và thiết lập kỹ thuật trong kho lưu trữ GitHub EXPLORE của tôi dưới mục CX16 v3 – LLM vs PvP-AI.
Với những kết quả đầy hứa hẹn này, cho nghiên cứu trong tương lai, tôi đang xem xét các "cảm giác thông minh" tiên tiến hơn như thị giác, thính giác và thăng bằng.
Bài viết liên quan

Phần mềm
Ra mắt Rail: Ngôn ngữ lập trình tự hosting tích hợp HTTPS thuần túy
18 tháng 4, 2026

Phần mềm
Tương lai "Headless" cho AI cá nhân: Khi giao diện dòng lệnh lên ngôi
18 tháng 4, 2026

Công nghệ
Cursor đàm phán huy động hơn 2 tỷ USD với định giá 50 tỷ USD khi tăng trưởng doanh nghiệp bùng nổ
17 tháng 4, 2026
