Anthropic tiết lộ 80% mã sản xuất mới do Claude viết: Doanh nghiệp cần làm gì để theo kịp?

Anthropic báo cáo rằng hơn 80% mã nguồn được hợp nhất vào sản xuất trong tháng 5 do AI Claude viết, giúp tăng năng suất gấp 8 lần cho mỗi kỹ sư. Bài viết phân tích lộ trình chuyển đổi sang tác nhân tự chủ và các thách thức về văn hóa, bảo mật mà doanh nghiệp cần đối mặt để áp dụng mô hình này.

Dario Amodei, đồng sáng lập và CEO của Anthropic, từng dự đoán về điều này, nhưng nó vẫn đánh dấu một cột mốc quan trọng: Hơn 80% mã nguồn được hợp nhất vào cơ sở mã sản xuất của Anthropic vào tháng 5 không phải do con người viết, mà bởi mô hình AI của chính họ, Claude. Đây là thông tin được công ty khởi nghiệp AI hàng đầu chia sẻ trong một báo cáo mới.

Sự chuyển đổi này đã kích hoạt mức tăng 8 lần về lượng mã nguồn mà mỗi kỹ sư xuất bản mỗi quý so với mức cơ sở từ năm 2021 đến 2025 của công ty. Điều này đồng nghĩa với việc có nhiều mã nguồn hơn cần được "ai đó" hoặc "điều gì đó" xem xét và đánh giá.

Đối với các lãnh đạo kỹ thuật trong doanh nghiệp, đây không còn là một tò mò nghiên cứu mang tính địa phương; nó là một mức cạnh tranh cơ bản mới và đầy áp lực. Nếu một phòng thí nghiệm AI hàng đầu có thể chuyển giao thành công phần lớn sản lượng kỹ thuật của mình cho các tác nhân tự chủ — cho thấy dấu hiệu của "chén thánh" AI lâu nay được tìm kiếm: tự cải thiện đệ quy (recursive self-improvement), nơi các mô hình có thể tự nghiên cứu và nâng cấp chính mình — thì điều gì đang ngăn cản các doanh nghiệp ở các lĩnh vực khác tự động hóa nhiều hơn quá trình phát triển phần mềm nội bộ của họ bằng các tác nhân AI?

Rõ ràng, nói dễ hơn làm. Anthropic là một trong những nhà tạo ra chính của làn sóng AI thế hệ hiện tại, nên chúng ta mong đợi họ biết cách triển khai công nghệ này một cách hiệu quả. Tuy nhiên, đối với các doanh nghiệp khác muốn tăng lượng mã và quy trình công việc được xử lý bởi các tác nhân, bài đăng blog mới của Anthropic đã phác thảo một kế hoạch chung mà họ cũng có thể áp dụng để tái cấu trúc hoạt động và quy trình làm việc của mình nhằm tận dụng những tiến bộ mới nhất của AI.

Lộ trình của Anthropic mà các doanh nghiệp khác có thể theo đuổi

Sự chuyển dịch từ viết mã tập trung vào con người sang điều phối tự chủ đòi hỏi sự hiểu biết về sự tiến hóa của khả năng AI. Anthropic phác thảo một chuỗi lịch sử rõ ràng mà các doanh nghiệp có thể ánh xạ lên lộ trình chuyển đổi số của chính mình:

2021–2023 (Viết thủ công): Các kỹ sư viết mã và tài liệu trực tiếp trong các trình soạn thảo văn bản cục bộ.
2023–2025 (Trợ lý Chatbot): Các nhà phát triển sử dụng các mô hình ban đầu để tạo các đoạn mã ngắn, sao chép và dán thủ công đầu ra vào môi trường của họ.
2025–2026 (Tác nhân viết mã): Các tác nhân có khả năng chủ động viết và chỉnh sửa toàn bộ các tệp tin một cách tự chủ.
Hiện tại (Tác nhân tự chủ): Các tác nhân thực thi mã độc lập, gỡ lỗi trong môi trường trực tiếp, và ủy quyền các luồng công việc kéo dài nhiều giờ cho các tác nhân con chuyên biệt.

Sự tiến hóa nhanh chóng này được xác nhận bởi các điểm chuẩn bên ngoài. Các khung đánh giá kỹ thuật phần mềm như SWE-bench — giao nhiệm vụ cho các mô hình giải quyết các báo cáo lỗi thực trong các cơ sở mã nguồn mở phức tạp — đã bão hòa trong vòng hai năm.

Hơn nữa, các đánh giá khả năng kéo dài cho thấy các mô hình như Claude Opus 4.6 có thể duy trì hoạt động đáng tin cậy trong các nhiệm vụ kéo dài 12 giờ, trong khi Claude Mythos Preview vượt qua 16 giờ giải quyết vấn đề liên tục.

Nội bộ, bước nhảy vọt công nghệ còn rõ rệt hơn. Trên các vấn đề kỹ thuật phức tạp, mở rộng nơi ban đầu thiếu thông số kỹ thuật rõ ràng, tỷ lệ thành công của Claude đã tăng lên 76% vào tháng 5 năm 2026 — mức tăng 50 điểm chỉ trong sáu tháng. Trong các điểm chuẩn tối ưu hóa cô lập, nơi các mô hình được giao nhiệm vụ tăng tốc mã đào tạo mô hình AI, mô hình Mythos Preview nội bộ của Anthropic đã đạt tốc độ nhanh hơn 52 lần. Để so sánh, một nhà phát triển lành nghề thường cần từ bốn đến tám giờ tái cấu trúc thủ công để đạt tốc độ tăng vỏn vẹn 4 lần trên cùng một cơ sở mã đó.

Kế hoạch 3 bước để tự động hóa mã sản xuất hoàn chỉnh hơn

Để một doanh nghiệp tái tạo cột mốc 80% của Anthropic, những người ra quyết định kỹ thuật phải từ bỏ mô hình tư duy "trợ lý nhà phát triển" và chuyển sang kiến trúc "nhà máy tự động". Sự thay đổi này tác động đến quản lý sản phẩm, vận hành và quy trình làm việc của nhà phát triển theo ba cách riêng biệt:

1. Chuyển từ Thực thi Mã sang Giám sát Kiến trúc

Khi chi phí tạo mã gần như bằng không về thời gian con người, vai trò kỹ thuật chính chuyển từ viết phần mềm sang xác định mục tiêu và xem xét đầu ra. Các lãnh đạo doanh nghiệp phải đào tạo lại các nhà phát triển để đóng vai trò là kiến trúc sư hệ thống và người đánh giá. Như một nhân viên Anthropic nhận xét về thực tế vận hành của sự thay đổi này:

"Hình thức của công việc hiện nay đại khái là 'con người có ý tưởng, và các mô hình có khả năng triển khai, kiểm tra và đánh giá chúng nhanh hơn [một cấp độ lớn] so với trước đây'."

2. Vượt qua Nút thắt Review Mã

Tiêm lượng lớn mã do AI tạo ra vào một tổ chức chắc chắn tạo ra ma sát vận hành. Theo định luật Amdahl, sự tăng tốc của bất kỳ quy trình nào bị giới hạn nghiêm ngặt bởi các nút thắt nối tiếp, không tự động hóa của nó.

Tại Anthropic, việc ngập hệ thống với mã tổng hợp ngay lập tức biến quá trình review mã của con người thành một nút thắt quan trọng. Để đối phó, các nhóm doanh nghiệp phải triển khai các trình review mã AI tự động trực tiếp vào các đường ống Tích hợp liên tục/Triển khai liên tục (CI/CD).

Anthropic đã triển khai một trình review Claude tự động (một phiên bản công khai, Claude Code Review, được tung ra sử dụng thương mại vào tháng 3) có nhiệm vụ phân tích mọi pull request để tìm lỗi kiến trúc, lỗ hổng bảo mật và lỗi hồi quy trước khi hợp nhất. Các công ty chuyên biệt khác như Qodo cũng cung cấp các công cụ được thiết kế riêng cho mục đích này.

Trong trường hợp của Anthropic, các phân tích hồi cứu cho thấy lớp tự động này đã bắt được khoảng một phần ba các lỗi sản xuất chịu trách nhiệm cho các sự cố ngừng hoạt động trước đây trên trang web chính claude.ai.

3. Nhắm vào Nợ Vận hành Quy mô Lớn

Các doanh nghiệp thường bị tê liệt bởi bảo trì mã kế thừa và nợ kỹ thuật bị trì hoãn từ lâu. Thay vì triển khai các tác nhân để viết các tính năng mới mang tính suy đoán, các lãnh đạo kỹ thuật nên hướng các tác nhân tự chủ vào các hoạt động dọn dẹp tốn công sức và khép kín.

Vào tháng 4 năm 2026, một kỹ sư Anthropic đã triển khai Claude để giải quyết một lớp lỗi API dai dẳng. Vận hành tự chủ, mô hình đã xuất bản hơn 800 bản sửa chữa riêng lẻ, thành công giảm tỷ lệ lỗi xuống một phần 1.000. Kỹ sư giám sát ước tính rằng một nhà phát triển con người sẽ mất bốn năm ròng để thực hiện cùng một công việc đó, do tải nhận thức khi phải giữ bối cảnh mã khổng lồ, không quen thuộc trong đầu cùng một lúc.

Các cân nhắc cho doanh nghiệp tiến về phía trước trong kỷ nguyên mã do AI tạo ra chủ yếu

Vận hành một cơ sở mã chủ yếu do AI viết ra giới thiệu các thách thức quản trị độc đáo mà các nhóm pháp lý và bảo mật của doanh nghiệp phải điều hướng.

Khác với các mô hình cấp phép nguồn mở (như giấy phép MIT cho phép hoặc các khuôn khổ GPL copyleft), các cơ sở mã doanh nghiệp sử dụng cơ sở hạ tầng LLM độc quyền vẫn chịu sự điều chỉnh của các điều khoản dịch vụ thương mại của nhà cung cấp AI tương ứng.

Việc triển khai các tác nhân tự chủ đòi hỏi các giao thức xác minh nghiêm ngặt để đảm bảo tuân thủ, bảo mật và bảo vệ sở hữu trí tuệ:

Chất lượng và Bảo trì Mã: Dữ liệu nội bộ của Anthropic cho thấy rằng trong khi mã do AI viết chất lượng thấp hơn đầu ra của con người vào cuối năm 2025, nó đã đạt sự ngang bằng vào giữa năm 2026, với kỳ vọng sẽ vượt qua tiêu chuẩn con người trong năm nay. Quản trị doanh nghiệp phải thích nghi với thực tế rằng chất lượng đầu ra tự động cơ bản về mặt cấu trúc vượt qua mã hóa thủ công trung bình.
Kiểm toán Bảo mật ở Quy mô Lớn: Khối lượng khổng lồ của việc tạo mã tự động đòi hỏi sự phát hiện lỗ hổng tự động. Dự án Glasswing của Anthropic minh họa quy mô của vấn đề này: sử dụng Mythos Preview, dự án đã xác định hơn 10.000 lỗ hổng phần mềm mức độ cao và nghiêm trọng trên toàn cầu chỉ trong vài tuần đầu tiên. Điều này đã chuyển thách thức bảo mật mạng doanh nghiệp hoàn toàn từ việc phát hiện lỗ hổng sang tốc độ triển khai bản vá.
Rủi ro của Sự Sai lệch Tích tụ (Alignment Cascades): Các lãnh đạo kỹ thuật phải duy trì các cổng xác minh nghiêm ngặt. Nếu một doanh nghiệp sử dụng hệ thống AI để liên tục sửa đổi, bảo trì và mở rộng cơ sở hạ tầng phần mềm độc quyền của mình, các lỗi không được phát hiện hoặc sự sai lệch tinh tế có thể tích tụ qua các phiên làm việc của tác nhân, dần dần làm hỏng tính toàn vẹn của hệ thống hoặc đưa vào các khai thác bảo mật thoát khỏi sự chú ý của con người.

Chuẩn bị cho sự xáo trộn văn hóa doanh nghiệp nội bộ

Sự chuyển đổi sang cơ sở mã do AI thống trị đang thay đổi động lực văn hóa của các nhóm kỹ thuật, giới thiệu cả hiệu quả chưa từng có và ma sát tâm lý sâu sắc.

Công khai, Anthropic đã định hình các số liệu này như một điềm báo của một sự chuyển đổi rộng lớn hơn. Trong một tuyên bố chính thức trên X, công ty quan sát:

"Dữ liệu nội bộ của chúng tôi cho thấy Claude đang tăng tốc phát triển AI — một con đường có thể dẫn đến tự cải thiện đệ quy, hoặc AI tự chủ xây dựng một người kế thừa có khả năng hơn. Nó đang diễn ra nhanh hơn chúng tôi nghĩ, và các tác động xứng đáng được chú ý nhiều hơn."

Họ mở rộng các tác động về năng suất ngay sau đó:

"Ngày nay, các kỹ sư Anthropic trung bình xuất bản nhiều mã hơn gấp 8 lần mỗi quý so với họ trong giai đoạn 2021-2025... Nhiều kỹ sư cũng nói chất lượng mã của Claude hiện nay ngang bằng với mã của con người; chúng tôi kỳ vọng nó sẽ tốt hơn trong năm nay."

Đằng sau các số liệu doanh nghiệp này là một thực tế con người phức tạp. Các trao đổi nội bộ của nhân viên tiết lộ sự xói mòn rõ rệt của sự hợp tác nơi làm việc truyền thống, khi sự tương tác giữa các nhà phát triển ngang hàng được thay thế có hệ thống bởi các lệnh gọi tác nhân không đồng bộ:

"Công việc (và cuộc sống) vận hành dựa trên nền kinh tế quà tặng của những ân tình nhỏ giữa con người. 'Bạn có thể giúp tôi chạy đoạn script này không?' [...] mỗi cái tạo ra một chút nợ, một chút nhận biết lẫn nhau. Claude đã nuốt chửng những ân tình này. Nó nhanh hơn, nó tạo ra nợ bằng không, nhưng mỗi cái này là một mất mát trong sự hợp tác giữa người với người."

Đối với những người đóng góp cá nhân, việc tự động hóa hoàn toàn bộ kỹ năng cốt lõi của họ giới thiệu sự lo lắng nghề nghiệp cấp tính về tính phù hợp và kiểm soát hệ thống:

"Tôi bắt đầu nghiêng về việc 'Claudify' khoảng một năm trước. Đó là một cuộc phiêu lưu điên rồ và giờ đã được ~5 tháng kể từ lần cuối tôi tự viết bất kỳ mã nào."

"Vào những ngày mọi thứ hoạt động tốt, tôi không thể không nghĩ rằng những gì tôi làm không quan trọng, mọi thứ đều tự động hóa và tốt hơn và nhanh hơn tôi từng có thể. Nhưng rồi có những ngày mọi thứ bị hỏng và tôi không hiểu tại sao và tôi nhận ra tôi không còn biết mình đang làm gì nữa."

Các lãnh đạo doanh nghiệp nhằm mục đích bắt kịp tốc độ kỹ thuật của Anthropic không thể đủ khả năng để bỏ qua các động lực tâm lý này. Đạt được cơ sở mã tự động hóa 80% đòi hỏi nhiều hơn là mua mã thông báo API hoặc cấu hình các vòng lặp tác nhân; nó đòi hỏi một cuộc đại tu văn hóa tổng thể, một chiến lược để giảm bớt sự lo lắng về sự lỗi thời của nhà phát triển, và việc triển khai các rào chắn xác minh tự động nghiêm ngặt để duy trì sự kiểm soát cuối cùng của con người đối với ngăn xếp phần mềm.