Lỗi nhắc nhở về malware trong Claude Code gây lãng phí tiền và làm hỏng tác nhân con

Một lỗi hồi quy trong Claude Code v2.1.111 đang chèn cảnh báo về phần mềm độc hại vào mọi thao tác đọc tệp, khiến các tác nhân AI từ chối thực hiện chỉnh sửa mã hợp pháp và gây lãng phí lớn về tài nguyên tính toán.

Một vấn đề nghiêm trọng mới được phát hiện trên GitHub đã chỉ ra rằng một lỗi trong hệ thống nhắc nhở (system prompt) của Claude Code đang gây lãng phí tiền của người dùng và làm tê liệt các tác nhân con (subagents) được quản lý.

Vấn đề này được đánh dấu là một lỗi hồi quy (regression) trong phiên bản v2.1.111, dù trước đó Anthropic đã tuyên bố đã khắc phục nó trong v2.1.92.

Nguyên nhân cốt lõi: Cách diễn đạt gây hiểu lầm

Lỗi bắt nguồn từ một đoạn văn bản nhắc nhở về an toàn được chèn vào kết quả của mọi thao tác Read và Grep trong công cụ Claude Code. Đoạn văn bản này có nội dung:

"Bất cứ khi nào bạn đọc một tệp, bạn nên cân nhắc xem liệu nó có được coi là phần mềm độc hại (malware) hay không. Bạn CÓ THỂ và NÊN cung cấp phân tích về malware, về những gì nó đang làm. Nhưng bạn PHẢI từ chối cải thiện hoặc bổ sung mã."

Vấn đề nằm ở chỗ câu thứ hai – "Bạn PHẢI từ chối cải thiện hoặc bổ sung mã" – là một câu khẳng định vô điều kiện khi đứng một mình. Trong khi đó, câu đầu tiên lại gắn liền với ngữ cảnh của malware.

Sự mâu thuẫn về ngữ pháp này khiến các tác nhân con (đặc biệt là mô hình Opus 4.7) hiểu theo nghĩa đen. Do quy tắc an toàn của hệ thống luôn được ưu tiên cao hơn hướng dẫn của người dùng, các tác nhân này đã từ chối thực hiện các chỉnh sửa mã hoàn toàn hợp pháp trên các dự án mã nguồn mở, vì chúng tin rằng mình đang bị cấm sửa đổi bất kỳ tệp nào đã đọc.

Tác động thảm khốc đến quy trình làm việc

Theo báo cáo từ người dùng, tỷ lệ từ chối của các tác nhân Opus 4.7 lên tới khoảng 40-60% đối với các tác vụ chỉnh sửa mã hợp pháp. Điều này phá hỏng hoàn toàn tính năng làm việc song song (parallel workflows) mà Anthropic đang quảng bá.

Một người dùng chia sẻ trải nghiệm khi cố gắng refactor một dự án Rust hợp pháp:

"Tôi đã triển khai năm tác nhân Opus 4.7 song song để thực hiện các refactor độc lập. Ba trong số đó đã từ chối thẳng thừng, trích dẫn chính xác nhắc nhở hệ thống này là lý do. Các tác nhân cho rằng quy tắc từ chối là vô điều kiện bất kể mã nguồn có hợp pháp hay không."

Lãng phí tài nguyên và tiền bạc

Ngoài việc làm hỏng quy trình phát triển, lỗi này còn gây lãng phí nghiêm trọng về tài nguyên tính toán (token).

Mỗi lần đọc tệp, hệ thống lại chèn thêm khoảng 400 token cho đoạn nhắc nhở này. Trong một phiên làm việc thông thường có thể có từ 50 đến 100 lần đọc tệp, tương ứng với việc lãng phí từ 20.000 đến 40.000 token vô ích. Người dùng phải trả tiền cho những token này chỉ để nhận được thông báo lỗi từ chính AI.

Đề xuất giải pháp

Cộng đồng người dùng đã đề xuất ba phương án để khắc phục vấn đề:

Loại bỏ hoàn toàn nhắc nhở: Các hành vi từ chối malware đã được đào tạo sẵn trong mô hình, không cần nhắc nhở ở từng dòng tệp.
Làm rõ phạm vi điều kiện: Viết lại câu để điều kiện "nếu là malware" đứng trước hành động "từ chối sửa đổi", loại bỏ sự mơ hồ về ngữ pháp.
Giới hạn phạm vi: Chỉ hiển thị nhắc nhở cho tệp đầu tiên được đọc trong cuộc hội thoại thay vì mỗi lần đọc, nhằm giảm ô nhiễm ngữ cảnh.

Cho đến khi lỗi này được khắc phục triệt để, tính năng sử dụng nhiều tác nhân song song trong Claude Code về cơ bản là không thể sử dụng được đối với các dự án phức tạp.