Anthropic công bố nguyên nhân và giải pháp cho các vấn đề chất lượng gần đây của Claude Code

Anthropic đã xác định và khắc phục ba lỗi kỹ thuật riêng biệt gây ảnh hưởng đến chất lượng phản hồi của Claude Code trong tháng qua. Công ty cam kết cải thiện quy trình kiểm thử và đặt lại giới hạn sử dụng cho tất cả người dùng đăng ký.

Trong tháng qua, Anthropic đã tiến hành điều tra kỹ lưỡng các báo cáo cho thấy chất lượng phản hồi của Claude đã suy giảm đối với một số người dùng. Sau quá trình rà soát, công ty đã xác định nguyên nhân xuất phát từ ba thay đổi riêng biệt ảnh hưởng đến Claude Code, Claude Agent SDK và Claude Cowork. Tuy nhiên, lớp API và inference không bị ảnh hưởng bởi sự cố này.

Tính đến ngày 20/4 (phiên bản v2.1.116), cả ba vấn đề trên đã được giải quyết hoàn toàn. Bài viết này sẽ đi sâu vào những gì Anthropic đã tìm thấy, cách họ khắc phục và các biện pháp sẽ được áp dụng để đảm bảo các sự cố tương tự khó có khả năng xảy ra một lần nữa.

Minh họa về Claude Code

Ba vấn đề kỹ thuật chính được xác định

Anthropic khẳng định họ không bao giờ cố ý làm giảm chất lượng mô hình và đã xác nhận ngay lập tức rằng API và lớp inference của họ hoạt động bình thường. Sau khi điều tra, họ đã xác định được ba vấn đề khác nhau:

Thay đổi mức độ suy luận mặc định (Reasoning Effort): Vào ngày 4/3, mức độ suy luận mặc định của Claude Code được chuyển từ cao xuống trung bình để giảm độ trễ. Đây là một sự đánh đổi sai lầm và đã được hoàn tác vào ngày 7/4.
Lỗi tối ưu hóa bộ nhớ đệm (Caching): Vào ngày 26/3, một thay đổi nhằm xóa các suy nghĩ cũ của Claude khỏi các phiên không hoạt động quá một giờ đã gặp lỗi. Thay vì chỉ xóa một lần, nó liên tục xóa trong suốt phiên, khiến Claude trở nên hay quên và lặp lại. Lỗi này được sửa vào ngày 10/4.
Thay đổi System Prompt: Vào ngày 16/4, một hướng dẫn hệ thống được thêm vào để giảm sự dài dòng. Khi kết hợp với các thay đổi prompt khác, nó đã làm giảm chất lượng viết mã và đã được hoàn tác vào ngày 20/4.

Chi tiết các lỗi và cách khắc phục

Thay đổi mức độ suy luận mặc định

Khi ra mắt Opus 4.6 cho Claude Code vào tháng 2, Anthropic đã đặt mức độ suy luận mặc định ở mức cao (high). Tuy nhiên, người dùng đã phản hồi rằng chế độ này đôi khi khiến Claude suy nghĩ quá lâu, gây ra độ trễ lớn và làm giao diện có vẻ bị đóng băng.

Giao diện và hiệu suất của Claude

Trong các bài kiểm tra nội bộ, mức độ nỗ lực trung bình (medium) đạt được trí thông minh hơi thấp hơn nhưng độ trễ giảm đáng kể cho đa số nhiệm vụ. Do đó, Anthropic đã thay đổi mặc định sang mức trung bình. Tuy nhiên, người dùng nhanh chóng phản hồi rằng Claude Code có vẻ kém thông minh hơn.

Nghe theo phản hồi từ khách hàng, Anthropic đã đảo ngược quyết định này vào ngày 7/4. Hiện tại, tất cả người dùng mặc định sử dụng mức độ xhigh cho Opus 4.7 và high cho các mô hình khác.

Lỗi tối ưu hóa bộ nhớ đệm khiến Claude "mất trí nhớ"

Thông thường, khi Claude suy nghĩ qua một nhiệm vụ, quá trình suy luận đó sẽ được giữ trong lịch sử trò chuyện để nó có thể hiểu lý do tại sao mình thực hiện các chỉnh sửa và gọi công cụ.

Vào ngày 26/3, Anthropic đã triển khai một tính năng cải thiện hiệu suất: nếu phiên không hoạt động quá một giờ, hệ thống sẽ xóa các phần suy nghĩ cũ để giảm chi phí khi người dùng tiếp tục sử dụng. Tuy nhiên, việc triển khai đã gặp lỗi nghiêm trọng. Thay vì chỉ xóa lịch sử suy nghĩ một lần, hệ thống lại xóa nó ở mọi lượt chuyển tiếp trong suốt phiên đó.

Hậu quả là Claude ngày càng không nhớ lý do nó đã chọn làm gì, dẫn đến hiện tượng hay quên, lặp lại các hành động và lựa chọn công cụ kỳ lạ. Lỗi này đã được sửa vào ngày 10/4 trong phiên bản v2.1.101.

Thay đổi System prompt ảnh hưởng đến chất lượng mã

Mô hình mới nhất Claude Opus 4.7 có đặc điểm hành vi khá dài dòng so với người tiền nhiệm. Để khắc phục, Anthropic đã thêm một hướng dẫn vào hệ thống prompt:

"Giới hạn độ dài: giữ văn bản giữa các lần gọi công cụ ≤ 25 từ. Giữ phản hồi cuối cùng ≤ 100 từ trừ khi nhiệm vụ yêu cầu chi tiết hơn."

Mặc dù đã thử nghiệm nội bộ trong nhiều tuần, nhưng khi áp dụng rộng rãi vào ngày 16/4, nó đã gây ra tác động tiêu cực đến trí thông minh của Claude Code. Các bài đánh giá sau đó cho thấy sự sụt giảm 3% chất lượng cho cả Opus 4.6 và 4.7. Anthropic đã ngay lập tức hoàn tác thay đổi này vào ngày 20/4.

Các biện pháp cải thiện trong tương lai

Để tránh các vấn đề tương tự, Anthropic cam kết thực hiện một số thay đổi quan trọng trong quy trình vận hành:

Tăng tỷ lệ nhân viên nội bộ sử dụng bản dựng công khai chính xác của Claude Code (thay vì phiên bản dùng để thử nghiệm tính năng mới).
Cải thiện công cụ Code Review nội bộ và cung cấp phiên bản cải tiến này cho khách hàng.
Kiểm soát chặt chẽ hơn các thay đổi system prompt, chạy bộ đánh giá rộng rãi cho mọi thay đổi.
Xây dựng công cụ mới để việc thay đổi prompt dễ dàng xem xét và kiểm toán hơn.

Quy trình làm việc và kiểm soát chất lượng

Anthropic cũng đã tạo tài khoản @ClaudeDevs trên X để giải thích sâu hơn về các quyết định sản phẩm. Cuối cùng, để xin lỗi người dùng vì trải nghiệm không mong muốn này, Anthropic đang đặt lại giới hạn sử dụng cho tất cả người dùng đăng ký tính đến ngày 23/4.

Công ty bày tỏ sự biết ơn sâu sắc đối với những phản hồi từ cộng đồng, đặc biệt là những người đã sử dụng lệnh /feedback hoặc đăng các ví dụ có thể tái hiện lỗi lên mạng, giúp họ xác định và khắc phục vấn đề.

Anthropic công bố nguyên nhân và giải pháp cho các vấn đề chất lượng gần đây của Claude Code

Ba vấn đề kỹ thuật chính được xác định

Chi tiết các lỗi và cách khắc phục

Thay đổi mức độ suy luận mặc định

Lỗi tối ưu hóa bộ nhớ đệm khiến Claude "mất trí nhớ"

Thay đổi System prompt ảnh hưởng đến chất lượng mã

Các biện pháp cải thiện trong tương lai

Bài viết liên quan