George Hotz: "Tháng 9 Vĩnh cửu" và cảnh báo về việc lạm dụng AI Agents trong lập trình

George Hotz, nhà phát triển nổi tiếng, cho rằng việc áp dụng AI Agents vào phát triển phần mềm là một trong những sai lầm tốn kém nhất lịch sử. Mặc dù hữu ích cho việc tìm kiếm và tạo mẫu nhanh, các mô hình này thực chất chỉ bắt chước thống kê và tạo ra mã nguồn bị lỗi một cách tinh vi, gây hại cho chất lượng phần mềm trong dài hạn.

George Hotz (geohot), một nhân vật nổi tiếng trong giới công nghệ và bảo mật, vừa đưa ra một nhận định gây tranh cãi nhưng đáng suy ngẫm về tương lai của lập trình. Ông dự đoán rằng việc áp dụng rộng rãi AI Agents (tác nhân AI) vào quy trình phát triển phần mềm sẽ trở thành một trong những sai lầm tốn kém nhất trong lịch sử ngành công nghiệp này.

Theo Hotz, các tác nhân AI thực chất không thể lập trình. Chúng chỉ là các mô hình thống kê tinh vi được thiết kế để bắt chước phân phối của mã nguồn. Kết quả đầu ra thường bị hỏng, nhưng theo một cách ngày càng khó phát hiện—đúng như những gì chúng ta mong đợi từ một mô hình thống kê ngày càng chính xác hơn.

Thử nghiệm thực tế và ảo tưởng về năng suất

Ban đầu, Hotz cũng đã tự đặt câu hỏi về sự hoài nghi của mình. Liệu ông có đang phòng thủ vì lo âu về địa vị (status anxiety) hay không? Ông tự hỏi liệu khả năng lập trình—một phần định hình giá trị bản thân của ông—có đang bị đe dọa bởi sự trỗi dậy của các mô hình ngôn ngữ lớn (LLM). Tuy nhiên, ông nhận ra rằng mình không cảm thấy bị đe dọa bởi các công cụ khác như AFL (công cụ fuzzing tìm lỗi) hay AI trong cờ vua, mà vấn đề nằm ở chỗ AI Agents không thực sự làm tốt vai trò của một kỹ sư phần mềm.

Trong 6 tháng qua, Hotz đã nỗ lực sử dụng các tác nhân AI cho các dự án của mình, bao gồm viết mã cho thư viện tinygrad và even đảo ngược một chip USB/PCIe. Kết quả ông nhận được là không khả quan. Mặc dù AI tạo ra sự tiến bộ nhanh chóng ở giai đoạn đầu (frontloads progress), nhưng nó giống như một chiếc máy đánh bạc: bạn kéo cần và hy vọng nó sẽ hoàn thiện phần còn lại. Nhưng nó "không bao giờ thực sự đạt được đích đến".

AI là công cụ hỗ trợ, không phải kỹ sư thay thế

Hotz khẳng định rằng ông không phủ nhận tính hữu ích của AI. Nó hoạt động tốt hơn Google trong việc tìm kiếm thông tin và cực kỳ nhanh khi bạn cần một bản mẫu nhanh (prototype) mà không quá quan tâm đến sự hoàn thiện. Tuy nhiên, nó chưa bao giờ đạt đến ngưỡng của một kỹ sư phần mềm tại bất kỳ công ty công nghệ nào ông từng làm việc.

Chìa khóa nằm ở việc biết khi nào nên sử dụng và khi nào không nên sử dụng nó.

Tác động tiêu cực đến các tổ chức lớn

Một trong những quan điểm sâu sắc nhất của Hotz là tác động của AI Agents đối với cấu trúc tổ chức. Ông nhận thấy rằng những cá nhân có hiệu suất cao (high performers) đều có khả năng tự sửa lỗi và biết nhận diện khi nào mã nguồn là "rác" (slop). Họ sử dụng AI một cách thận trọng, luôn đọc và hiểu từng dòng mã.

Ngược lại, trong các tổ chức lớn với vòng lặp phản hồi chậm chạp, những nhân viên có hiệu suất thấp sẽ không có khả năng tự kiểm soát này. Họ là những người sẽ tạo ra sản lượng gấp 10 lần nhờ AI, nhưng chất lượng trung bình của tổ chức đó sẽ đi xuống.

"Agents sẽ kết thúc việc tạo ra nhiều mã nguồn, nhiều ứng dụng và nhiều tính năng hơn bao giờ hết. Đây là thời kỳ hoàng kim cho những thùng rác chất đống mã nguồn kém chất lượng, và là thời kỳ đen tối cho những viên ngọc chất lượng."

Vấn đề cốt lõi: Thiếu mô hình thế giới (World Models)

Hotz bày tỏ sự đồng tình với quan điểm của Yann LeCun và Gary Marcus về LLM. Ông tin rằng các mô hình hiện tại sẽ không bao giờ có thể lập trình thực thụ vì quy trình tư duy (process) quan trọng hơn kết quả đầu ra đơn thuần. Mặc dù Deep Learning vẫn là giải pháp, nhưng các tác nhân lập trình thực sự sẽ cần các "mô hình thế giới" (world models), chứ không phải chỉ là các kỹ thuật như RLVR (Reinforcement Learning from Virtual Reality) đơn thuần comment out các bài test thất bại để báo cáo "tất cả đều pass".

Câu hỏi lớn mà Hotz đặt ra là: Khi Apple đang thúc đẩy AI lên tất cả các kỹ sư của họ, liệu macOS sẽ trở nên tốt hơn hay tệ hơn trong 2 năm tới?

Câu chuyện thực sự của thời đại này sẽ là ai là người quản lý để tránh làm hại chính mình trong cơn "tâm thần phân liệt về AI" (AI psychosis) này.