Cái giá của hiệu suất 10x: AI đang làm "gãy" thể chất và tinh thần của các kỹ sư cấp cao

AI giúp tăng tốc độ sản xuất mã nguồn nhưng lại đẩy khối lượng công việc kiểm duyệt lên 98%, vượt quá khả năng xử lý của não bộ con người. Điều này dẫn đến tình trạng kiệt sức nghiêm trọng và các vấn đề sức khỏe thể chất đối với các kỹ sư cấp cao, những người phải gánh vác trách nhiệm đảm bảo chất lượng.

Não bộ con người chỉ xử lý được 10 bit mỗi giây. Nhưng AI vừa tăng hàng đợi review code của bạn lên 98%. Toán học ở đây không còn hợp lý nữa.

Vào thứ Ba tuần trước, tôi đứng dậy khỏi bàn làm việc lúc 7 giờ tối và cảm thấy một khoảng trống ngay phía trước hộp sọ. Không phải đau đầu. Không phải mệt mỏi. Đó là một sự trống rỗng về mặt thể chất, như thể thùy trán đã hoạt động hết công suất cả ngày và cuối cùng đã tắt ngấm. Tôi đứng đó mười giây cố nhớ mình định làm tiếp theo là gì. Không có gì cả.

Trong năm qua, khối lượng thông tin đi qua não bộ tôi vào bất kỳ thứ Ba nào đã trở nên tương đương với một tuần làm việc trước đây. Code review là khủng khiếp nhất, nhưng sát thủ thực sự là những lần chuyển đổi ngữ cảnh (context switches). Những Pull Request (PR) do AI tạo ra, các quyết định kiến trúc khách hàng, ba luồng thảo luận trên Slack về vấn đề triển khai, một CV ứng viên cần xem xét, rồi lại quay lại xem xét đoạn code mà máy móc viết trong vài giây nhưng tôi cần hàng giờ để xác thực. Mỗi yêu cầu đòi hỏi một mô hình tinh thần khác nhau. Mỗi cái đều đốt cháy bộ nhớ làm việc. Đến 4 giờ chiều, tôi đưa ra những quyết định mà tôi không tin tưởng ngay cả với một Junior. Đến 7 giờ tối, não bộ tôi thực sự rỗng tuếch.

Ngành công nghiệp gọi đây là "năng suất 10x". Tôi gọi nó bằng đúng tên của nó: một hệ thống tạo ra đầu ra với tốc độ của máy móc và ép buộc con người xử lý nó với tốc độ sinh học.

Sự quá tải nhận thức của kỹ sư

Sự gia tăng khối lượng công việc âm thầm

Vào tháng 2 năm 2026, các nhà nghiên cứu tại UC Berkeley đã công bố phát hiện từ tám tháng đắm mình trong một công ty công nghệ có 200 nhân viên. Hơn 40 cuộc phỏng vấn sâu. Kết luận của họ: AI không làm giảm công việc. Nó làm tăng cường độ công việc.

Họ tìm thấy ba cơ chế của "sự gia tăng khối lượng công việc âm thầm":

Mở rộng nhiệm vụ: Phạm vi công việc của mọi người bị phình ra vì AI giúp làm được nhiều việc hơn.
Ranh giới mờ nhạt: Viết lệnh cho AI (prompting) diễn ra trong bữa trưa, đi làm, và buổi tối.
Áp lực ngầm: Khi đồng nghiệp rõ ràng làm được nhiều việc hơn với AI, kỳ vọng đối với mọi người cũng tăng lên.

Viện Nghiên cứu Upwork đã định lượng điều này: 77% nhân viên sử dụng AI nói rằng nó đã làm tăng khối lượng công việc của họ. Không phải giảm đi. Mà là tăng thêm. 71% báo cáo tình trạng kiệt sức (burnout).

Phát hiện khiến tôi mất ngủ là: những công nhân báo cáo lợi ích năng suất AI cao nhất lại là những người kiệt sức nhất. Tỷ lệ kiệt sức lên tới 88% trong số "người dùng AI năng suất nhất". Họ có khả năng bỏ việc gấp đôi.

Những người trông tốt nhất trên bảng điều khiển của bạn là những người gần bước ra khỏi cửa nhất.

Não bộ bạn chạy ở tốc độ 10 bit mỗi giây

Năm 2025, Zheng và Meister đã công bố trên tạp chí Neuron rằng não bộ con người xử lý suy nghĩ có ý thức, phân tích với tốc độ khoảng 10 bit mỗi giây. Hệ thống giác quan của bạn thu thập dữ liệu với tốc độ khoảng 1 tỷ bit mỗi giây. Nhưng điểm nghẽn cho việc review code — phần bạn thực sự suy nghĩ — là 10 bit mỗi giây.

Bộ nhớ làm việc chỉ giữ được khoảng 4 khối thông tin cùng một lúc. Nghiên cứu của SmartBear/Cisco đã đưa ra những con số mà mọi người phớt lờ: tỷ lệ phát hiện lỗi giảm từ 87% đối với các PR dưới 100 dòng code xuống còn 28% đối với các PR trên 1.000 dòng. Chất lượng sụp đổ sau 60 phút.

Bây giờ hãy xem AI đã làm gì với hàng đợi review.

GitHub Octoverse 2025 cho thấy 43,2 triệu pull request được hợp nhất mỗi tháng. Tăng 23% so với cùng kỳ năm trước. Số dòng code trên mỗi nhà phát triển tăng từ 4.450 lên 7.839 trong tám tháng. Một mức tăng 76%.

Faros AI phân tích hơn 10.000 nhà phát triển và thấy rằng người dùng AI hợp nhất nhiều hơn 98% pull request với sự hỗ trợ của AI. Mỗi cái trong số đó đều đổ dồn lên bàn của một kỹ sư cấp cao.

Như MIT đã báo cáo: các Junior tạo ra nhiều code hơn nhiều với công cụ AI, nhưng khối lượng khổng lồ đó đang bão hòa khả năng review của các Senior phát triển. Một người bảo trì OCaml đã từ chối thẳng thừng một PR do AI tạo ra dài 13.000 dòng. Không ai có đủ băng thông để xử lý.

Tôi gần đây đã viết về "thuế giám sát" (supervision tax). Dữ liệu của METR cho thấy các nhà phát triển có kinh nghiệm thực sự làm chậm lại khi sử dụng công cụ AI trong khi cảm thấy nhanh hơn. Khoảng cách giữa nhận thức và thực tế là phát hiện nguy hiểm nhất trong tất cả những điều này. Bạn không thể sửa chữa những gì bạn không cảm nhận được.

Tại sao chuyên môn lại làm mọi thứ tồi tệ hơn

Năm 1983, Lisanne Bainbridge đã công bố "Nghịch lý của Tự động hóa" trên tạp chí Automatica. Phát hiện cốt lõi của bà: hệ thống tự động hóa càng tinh vi, vai trò của con người trong hệ thống đó càng đòi hỏi khắt khe. Những gì còn lại sau khi tự động hóa là công việc mơ hồ nhất, phức tạp nhất và được hỗ trợ ít nhất.

Nghiên cứu của Microsoft đã xác nhận điều này đối với AI tạo sinh vào năm 2024: các hệ thống AI có thể làm cho các nhiệm vụ khó khăn trở nên khó khăn hơn, để lại cho người dùng khối lượng nhận thức giống nhau hoặc tăng lên.

Cơ chế này bất đối xứng. Khi tôi viết code, tôi ngoại hóa một mô hình tinh thần đã tồn tại. Suy nghĩ được thực hiện trước khi bắt đầu gõ phím. Khi tôi review code do AI tạo ra, tôi phải thiết kế ngược suy luận của người khác từ một sản phẩm được tạo ra bởi một hệ thống không có ý tưởng gì về doanh nghiệp của chúng ta. Về cơ bản, nó khó hơn nhiều.

Một cuộc khảo sát của Clutch với 800 chuyên gia phần mềm cho thấy 59% nhà phát triển sử dụng code do AI tạo ra mà họ không hiểu đầy đủ. Nhưng các Senior không thể có sự xa xỉ đó. Công việc của họ là bắt lấy những thứ trông có vẻ đúng nhưng thực tế không phải.

Báo cáo của Qodo đã xác nhận sự phân bổ chi phí: các kỹ sư cấp cao báo cáo mức độ tự tin thấp nhất khi triển khai code do AI tạo ra là 22%. Nỗi đau về ngữ cảnh tăng theo kinh nghiệm: 41% ở Junior so với 52% ở Senior. Như tôi đã đề cập trong việc "đỡ bớt nhận thức" (cognitive offloading), hầu hết người lao động sử dụng AI bỏ qua suy nghĩ phản biện hoàn toàn. Những Senior thực sự suy nghĩ phản biện — việc toàn bộ công việc của họ — phải gánh chịu chi phí nhận thức mà người khác đẩy ra ngoài.

Cơ thể vẫn ghi nhận mọi thứ

Thiệt hại về nhận thức chỉ là một nửa vấn đề. Cơ thể chịu phần còn lại.

Hội chứng thị giác máy tính (Computer Vision Syndrome) ảnh hưởng đến 74% người dùng màn hình trong các giai đoạn thời gian sử dụng màn hình tăng lên, và mức độ nghiêm trọng của mỏi mắt kỹ thuật số trở nên tồi tệ hơn đáng kể khi khối lượng nhận thức tăng lên. Việc review code được tăng cường bởi AI không chỉ có nghĩa là nhiều giờ trước màn hình hơn. Nó làm cho mỗi giờ trở nên gây hại hơn về mặt thể chất.

Một phân tích tổng hợp năm 2024 bao gồm 26.916 người tham gia cho thấy burnout làm tăng nguy cơ bệnh tim mạch lên 21%. Những người ở nhóm burnout cao nhất có nguy cơ mắc bệnh tim mạch vành cao hơn 79%. Nghiên cứu IT lớn nhất tìm thấy tỷ lệ hội chứng chuyển hóa là 32% trong số các lập trình viên ngồi lâu dài. Gấp đôi dân số nói chung.

Và rồi là giấc ngủ. Sự suy ngẫm về công việc làm trung gian cho mối liên hệ giữa căng thẳng công việc và chất lượng giấc ngủ giảm sút. Khi tôi đóng máy tính xách tay lại, não bộ tôi không dừng lại. Nó phát lại cái PR mà tôi chưa hoàn thành. Phụ thuộc mà tôi đã gắn cờ nhưng không thể truy xuất nguồn gốc.

Review nhiều code hơn vào ban ngày, ngủ kém hơn vào ban đêm, quyết định tồi tệ hơn vào sáng hôm sau, nhiều PR được đóng dấu "đồng ý" (rubber-stamped) hơn, nhiều lỗi hơn trong môi trường sản xuất, nhiều căng thẳng hơn. Lặp lại cho đến khi một thứ gì đó bị gãy. Thường là con người.

Bảng điều khiển nói dối

GitClear đã phân tích 211 triệu dòng code thay đổi. Các khối code trùng lặp tăng gấp tám lần. Tỷ lệ churn code (code viết rồi xóa) tăng từ 5,5% lên 7,9%. Code do AI tạo ra trung bình có nhiều lỗi hơn 1,7 lần mỗi PR so với code do con người viết. Lỗi logic tăng 75%. Vấn đề hiệu suất thường xuyên hơn 8 lần.

Kết luận của Faros AI sau khi phân tích hơn 10.000 nhà phát triển: mặc dù hợp nhất nhiều hơn 98% pull request với AI, việc giao diện công ty rộng rãi không cho thấy tác động tổ chức có thể đo lường nào đối với thông lượng hoặc chất lượng.

Giám đốc điều hành của Sonar đã xác định mối nguy hiểm tiềm ẩn: các mô hình AI đang trở nên tốt hơn trong việc tránh các lỗi rõ ràng và lỗ hổng bảo mật, nhưng các lỗi cấu trúc hiện chiếm hơn 90% các vấn đề. Bạn đang bị ru ngủ vào một cảm giác an toàn giả tạo. Những vấn đề dễ được giải quyết. Những vấn đề khó bị ẩn giấu dưới những đoạn code trông sạch sẽ vượt qua mọi kiểm tra tự động. Và những người có thể tìm ra chúng thì bị chôn vùi dưới một khối lượng đầu ra vượt quá băng thông nhận thức của con người theo thiết kế.

Nhiều code hơn. Nhiều lỗi hơn. Gánh nặng review nhiều hơn. Đầu ra giống nhau. Con người tệ hơn.

Toán học không hợp lý

Đây là điều mà không ai đang tính toán. AI vừa tăng nhu cầu về phán đoán kỹ thuật cấp cao lên 76 đến 98%. Mỗi PR do AI tạo ra cần một con người có thể bắt được sai sót mà máy móc gây ra, phát hiện lỗi cấu trúc ở dòng 847, truy xuất lỗi logic ba dịch vụ xuôi dòng. Nguồn cung của những con người đó không hề dịch chuyển. Và như tôi đã đề cập trong cuộc khủng hoảng nhân tài và sự tuyệt chủng của sự hiểu biết, đường ống sản xuất ra họ đang bị rỗng ruột bởi chính những công cụ tạo ra nhu cầu này.

Nhưng đây là nơi mà kỹ sư cấp cao thực sự sống vào năm 2026. Việc sa thải trong ngành công nghiệp ở một phía, hàng trăm nghìn kỹ sư bị cắt giảm kể từ năm 2022, đợt tiếp theo luôn chỉ cách một cuộc gọi báo cáo thu nhập. Kỳ vọng năng suất 10x ở phía bên kia, được đặt ra bởi những người chưa bao giờ review một PR do AI tạo ra trong đời họ. Ở giữa, có ai đó kiệt sức và cháy máy, với một lựa chọn phải thực hiện mỗi buổi sáng: tin tưởng đầu ra của AI, vì nó đã hoạt động hai mươi lần trước, phải không? Hay tiếp tục xác thực từng dòng cho đến khi cơ thể gục ngã.

Một người bình thường có thể giữ vững ranh giới đó trong bao lâu?

Và phần tồi tệ nhất: xác thực hay tin tưởng, kỹ sư đều sở hữu kết quả theo một cách nào đó. Khi hệ thống sản xuất bị sập lúc 3 giờ sáng, tên của bạn nằm trong commit. PR của bạn đã được hợp nhất. Báo cáo sự cố của bạn. Không có phiên bản lựa chọn nào trong đó bạn không phải chịu trách nhiệm.

Đó là một câu hỏi tu từ. Chúng ta đã biết câu trả lời. Dữ liệu trong bài viết này chính là câu trả lời.

Nếu bạn là một kỹ sư cấp cao cảm thấy điều này trong cơ thể mình, bạn không đơn độc và bạn không yếu đuối. Căng mắt. Giấc ngủ không phục hồi. Khoảng trống trong đầu vào cuối ngày. Bạn đang làm một công việc không tồn tại mười tám tháng trước, với thiết bị nhận thức không thay đổi trong 200.000 năm.

Cái giá của hiệu suất 10x: AI đang làm "gãy" thể chất và tinh thần của các kỹ sư cấp cao

Sự gia tăng khối lượng công việc âm thầm

Não bộ bạn chạy ở tốc độ 10 bit mỗi giây

Tại sao chuyên môn lại làm mọi thứ tồi tệ hơn

Cơ thể vẫn ghi nhận mọi thứ

Bảng điều khiển nói dối

Toán học không hợp lý

Bài viết liên quan