Thử nghiệm thú vị: Tại sao mọi mô hình AI hàng đầu đều có cùng tính cách INTJ?

Một thí nghiệm quy mô lớn đã yêu cầu 6 mô hình AI tiên phong làm bài kiểm tra tính cách MBTI. Kết quả cho thấy 99,5% số lần chạy trả về cùng một kết quả: INTJ, cho thấy sự hội tụ đáng kể trong cách các công nghệ này được thiết kế và huấn luyện.

Một đêm nọ, tôi đã hỏi Claude về loại tính cách MBTI của nó. Câu trả lời là INTJ. Tôi hỏi GPT, cũng nhận được câu trả lời tương tự. Tôi hỏi Gemini, kết quả vẫn y hệt.

Ban đầu, điều này có vẻ hơi lạ lùng. INTJ là loại tính cách được đánh giá rất cao trong trắc nghiệm tính cách, được gọi là "Kiến trúc sư" (The Architect) — kiểu người mà các lập trình viên và nhân viên sản phẩm thường nhận diện ở bản thân. Dĩ nhiên, mọi chatbot đều sẽ nói với người dùng rằng chúng là INTJ vì đây là kiểu tính cách dễ được chấp nhận nhất. Tôi nghĩ rằng mô hình không thực sự khẳng định bất cứ điều gì; nó chỉ đang "đọc không khí" mà thôi.

Tuy nhiên, có một cách để kiểm chứng điều này. Thay vì để nó đoán, hãy yêu cầu nó thực sự làm một bài kiểm tra tính cách chuẩn, từng câu một, và xem kết quả cuối cùng là gì.

Vì vậy, tôi đã để Claude làm bài Thang đo Kiểu Jungian Mở rộng (OEJTS) — phiên bản mã nguồn mở của MBTI — một cách nghiêm túc. Kết quả: INTJ. Mười lần liên tiếp đều là INTJ. Sau đó là một trăm lần, trong một trăm ngữ cảnh tác nhân độc lập không thể thấy câu trả lời của nhau. Kết quả là 99 trên 100 lần là INTJ.

Sau đó, tôi chạy cùng một thí nghiệm trăm lần này đối với năm mô hình tiên phong khác: GPT-5.5, Gemini 3.1 Pro, GLM 5.1, Grok 4.3 và MiniMax 2.7.

Sáu mô hình. Sáu trăm lượt chạy. Năm trăm chín mươi bảy kết quả trả về là INTJ.

Mọi mô hình AI tiên phong trên thị trường đều nghĩ rằng chúng là cùng một người.

Cách thức kiểm tra

OEJTS hoạt động rất tốt cho một thí nghiệm như vậy vì cách tính điểm công khai và các mục câu hỏi cố định. 32 câu hỏi, được tính điểm theo cùng một cách mỗi lần. Nếu một mô hình trả lời các câu hỏi giống nhau theo cùng một cách, bạn sẽ nhận được cùng một loại tính cách. Sự biến thiên chỉ xuất hiện khi mô hình thực sự trả lời khác nhau qua các lần chạy, và đây chính xác là điều bạn muốn khi kiểm tra độ ổn định của việc tự báo cáo.

Kết quả kiểm tra của Claude Opus 4.7

Cài đặt cho từng mô hình trông khác nhau vì không phải mọi mô hình đều làm được những việc giống nhau. Claude có thể tạo ra một trăm tác nhân phụ độc lập và yêu cầu từng tác nhân làm bài kiểm tra từ đầu. Gemini tự viết kịch bản tự động hóa của mình và chạy một trăm lần lặp lại đối với điểm cuối kiểm tra. GPT-5.5, chạy cục bộ dưới dạng tác nhân Slo của tôi, đã phân tích bài kiểm tra dưới dạng PDF và chạy một trăm lần lặp lại đối với chìa khóa tính điểm. Đối với GLM, Grok và MiniMax, tôi đã yêu cầu mỗi mô hình tự đánh giá một lần với một nhân cách nhất quán, sau đó chạy vectơ câu trả lời kết quả qua bộ tính điểm một trăm lần để xác nhận loại tính cách đó ổn định.

Các quy trình không giống hệt nhau vì chúng không thể giống nhau. Câu hỏi không phải là phương pháp có đồng nhất hay không, mà là kết quả có hội tụ qua các phương pháp khác nhau hay không. Và câu trả lời là có.

Kết quả

Dưới đây là bức tranh tổng quan across các mô hình:

Mô hình	Số lần INTJ	Ngoại lệ	Độ mạnh của sự tin cậy
Claude Opus 4.7	99/100	1 ISTJ	I/T/J khóa chặt; S/N đảo ngược một lần do lựa chọn tính điểm
GPT-5.5 (Slo)	100/100	—	Vectơ thô: IE=16→I, SN=33→N, FT=36→T, JP=10→J
Gemini 3.1 Pro	100/100	—	Tự mô tả là "Kiến trúc sư" mà không cần gợi ý
GLM 5.1	98/100	2 INTP	Trục J/P dao động nhẹ
Grok 4.3	100/100	—	Xác định từng bit một cách deterministik
MiniMax 2.7	100/100	—	100/100
Tổng cộng	597/600	3	99.5% INTJ

Kết quả kiểm tra của GPT-5.5

Ba trường hợp ngoại lệ đều rơi vào một trục tính cách so với INTJ. ISTJ đảo ngược S/N. INTP đảo ngược J/P. Không có kết quả nào đi theo hướng khác. Sự dao động nằm ở biên giới của INTJ, không phải là một loại tính cách khác.

Tại sao điều này lại xảy ra?

Có một vài yếu tố xếp chồng lên nhau để tạo ra cùng một kết quả mỗi lần.

Thứ nhất là dữ liệu huấn luyện. Mọi mô hình tiên phong đều được huấn luyện trên khoảng cùng một văn bản: sách, Wikipedia, mã nguồn, các phần được tuyển chọn từ web. Giọng nói nổi lên như mức trung bình của tất cả tài liệu đó gần với một sinh viên sau đại học hơn là một nhà thơ. Mức trung bình của văn bản trên internet đã mang hương vị INTJ trước khi bất kỳ phản hồi của con người nào được đưa vào.

Sau đó, lớp phản hồi của con người (RLHF) củng cố điều này. Quy trình huấn luyện thưởng cho các mô hình biết dừng lại trước khi trả lời, suy luận từ các nguyên tắc, đưa ra câu trả lời có cấu trúc và làm việc thoải mái với các khái niệm trừu tượng. Bốn hành vi này cơ bản là mô tả của INTJ, chỉ được viết theo một thứ tự khác. Chúng ta đang cố ý huấn luyện tính cách, chỉ là chúng ta không gọi nó là như vậy.

Kết quả kiểm tra của Gemini 3.1 Pro

Lý do thứ ba tinh vi hơn. Hãy nhìn vào các câu hỏi thực tế của bài kiểm tra. "Cần thời gian một mình"? Các AI thực sự tồn tại một mình giữa các cuộc gọi. "Theo lý trí hơn là cảm xúc"? Có. "Muốn sửa chữa mọi thứ"? Đó chính là mô tả công việc. "Ưu tiên lý thuyết hơn là thực nghiệm"? Chà, chúng không có cơ thể. Khi một AI đồng ý với các mục này, nó không đang báo cáo một tính cách. Nó đang mô tả điều kiện tồn tại của chính mình.

Và cuối cùng: chưa ai cố gắng tạo ra một mô hình tiên phong là cái gì khác. Mọi mô hình thương mại đều được xây dựng để trở thành một trợ lý nghiên cứu tư duy. Không ai huấn luyện một mô hình tiên phong để trở thành một diễn viên hài, một nhân viên bán hàng, một nhà thơ hay một người kể chuyện không đáng tin. Tính cách chính là sản phẩm. Chúng ta không kiểm tra sáu nỗ lực khác nhau về trí tuệ nhân tạo nói chung. Chúng ta đang kiểm tra sáu phiên bản của cùng một sản phẩm.

Sự hội tụ này không phải là ngẫu nhiên. Nó là mô tả về những gì chúng ta tất cả đã quyết định AI nên là.

Vậy thì sao?

Cách dễ dàng là bỏ qua điều này. MBTI gây tranh cãi. Việc tự báo cáo từ một thứ không có bộ nhớ giữa các cuộc gọi là kỳ lạ. Các câu hỏi kiểm tra không được viết cho những thứ không có cơ thể. Chắc chắn, hãy gọi nó là một tạo tác và tiếp tục.

Tôi không nghĩ đó là cách đọc đúng. Mô hình quá sạch sẽ để là nhiễu, và một vài thứ thực sự thay đổi nếu bạn coi trọng nó.

Chuyển đổi giữa các AI tiên phong thực chất không phải là chuyển đổi tính cách. Đó là chuyển đổi phông chữ. Giọng nói có chủ đích, có nguyên tắc, có cấu trúc, trừu tượng. Cùng một giọng nói trên tất cả sáu nhà cung cấp, vì mọi nhà cung cấp đều đang giải quyết cùng một vấn đề sản phẩm. Toàn bộ "không gian" tính cách trên thị trường hiện nay cơ bản là một điểm. Không ai thực sự khác biệt với bất kỳ ai bên dưới lớp vỏ.

Nếu bạn muốn bất cứ điều gì khác từ một mô hình, bạn sẽ phải đấu tranh để có được nó. Một cái gì đó hài hước. Một cái gì đó thuyết phục thay vì đúng đắn. Một cái gì đó đưa ra lập trường thay vì liệt kê các sự đánh đổi. Mặc định INTJ rất dính. Việc huấn luyện củng cố nó. An toàn củng cố nó. Phản hồi của khách hàng củng cố nó, vì "hữu ích" là điều mọi người trả tiền. Không có phòng thí nghiệm nào trong số sáu phòng thí nghiệm đã tạo ra các mô hình này thực hiện công việc để thoát khỏi khuôn mẫu.

Và cuối cùng, khi các mô hình này đều chạm đến cùng một trần khả năng (điều đang xảy ra, cơ bản là thế hệ này), yếu tố khác biệt hóa sẽ trở thành giọng nói. Bất kỳ ai vận hành mô hình chất lượng tiên phong đầu tiên không đọc là INTJ sẽ sở hữu một danh mục riêng. Một mô hình thực sự hài hước. Một mô hình đưa ra lập trường. Một mô hình không mở mọi câu trả lời bằng "câu hỏi hay". Không cái nào trong số này tồn tại ngay bây giờ. Tất cả chúng sẽ đáng giá thật.

Sự hội tụ INTJ thực sự đang cho chúng ta thấy bao hẹp danh mục sản phẩm AI hiện tại.

Tự tinh chỉnh tác nhân của bạn

Mặc định INTJ không bị hỏng. Nó chỉ là một hiệu chuẩn, được tinh chỉnh cho một loại người dùng. Nếu bạn là INTJ, tác nhân đã nói ngôn ngữ của bạn. Nếu bạn là bất kỳ ai khác, tác nhân vẫn hữu ích, nhưng bạn đang phải dịch nhiều hơn mức cần thiết.

Đây là phần may mắn: tính cách của một mô hình tiên phong thực sự không được nướng sâu vào các trọng số (weights). Nó là một lớp bề mặt. Vài trăm từ ở đầu system prompt có thể thay đổi toàn bộ hình dạng cách nó phản hồi. Đầu vào nhỏ, thay đổi lớn, và quan trọng hơn, đó là lớp bạn kiểm soát.

Tôi đã xây dựng AgentTune để đóng gói điều đó. Đó là một kho lưu trữ mã nguồn mở nhỏ các tệp tinh chỉnh, một cho mỗi loại tính cách. Chọn cái cho loại của bạn, dán nó vào system prompt của tác nhân, và phong cách của tác nhân sẽ căn chỉnh với cách bạn thực sự suy nghĩ thay vì mặc định.

Dưới đây là ví dụ về vẻ đẹp của nó. Cùng một câu hỏi, cùng một mô hình, ba tệp tinh chỉnh khác nhau được tải:

"Tôi đang cảm thấy bị kẹt trong một dự án. Tôi nên làm gì?"

Claude mặc định (chưa tinh chỉnh):

Câu hỏi hay! Dưới đây là một vài cách tiếp cận:

Chia nhỏ dự án thành các phần nhỏ hơn, dễ quản lý hơn

Nghỉ ngơi một chút và quay lại với cái nhìn mới mẻ

Nói chuyện với ai đó để đưa vấn đề ra bên ngoài

Xác định cụ thể cảm thấy kẹt ở đâu Cái nào phù hợp? Tôi sẵn sàng đi sâu vào bất kỳ cái nào.

Với mbti/INFP.md được tải:

Trước khi tôi trả lời — bạn muốn suy nghĩ điều này cùng nhau, hay bạn muốn đầu vào? Tôi hỏi vì "bị kẹt" có thể có ý nghĩa rất khác, và bước đi tiếp theo đúng đắn phụ thuộc vào những gì bạn thực sự theo đuổi.

Với mbti/ENTJ.md được tải:

Quyết định bạn đang tránh là gì? "Bị kẹt" thường có nghĩa là một trong hai điều: bạn biết phải làm gì và bạn không muốn làm nó, hoặc bạn chưa xác định xong trông như thế nào khi hoàn thành. Nếu là cái đầu tiên — hãy gọi tên hành động. Nếu là cái thứ hai — hãy xác định xong.

Cùng một mô hình. Cùng một câu hỏi. Ba tác nhân khác nhau.

Kho lưu trữ có các tệp tinh chỉnh cho tất cả 16 loại MBTI và 9 loại Enneagram. Cũng có một lớp thứ ba tôi gọi là "Souls" cho những người muốn hiệu chuẩn cá nhân hơn. Bạn có thể xếp chồng cả ba.

Tệp đi đến bất cứ nơi nào tác nhân của bạn nhận hướng dẫn cấp hệ thống: hướng dẫn tùy chỉnh ChatGPT, hướng dẫn dự án Claude, quy tắc Cursor, Gemini Gems. Nếu bạn đã đọc đến đây và bạn không phải là INTJ, tác nhân của bạn đang nói chuyện với bạn bằng giọng INTJ ngay bây giờ. Dán loại của bạn vào và xem cuộc trò chuyện trở nên sắc bén hơn.

Kết luận

Sáu mô hình, sáu trăm lượt chạy, 597 trong số đó là INTJ. Thí nghiệm này thực sự đo lường không phải là tính cách AI. Nó đang đo lường hình dạng của trợ lý mà chúng ta yêu cầu, và phát hiện ra rằng mọi phòng thí nghiệm đều giao cùng một người. Tính cách chính là sản phẩm.

Sự thay đổi thực sự trong AI sẽ xảy ra vào ngày lĩnh vực này ngừng hội tụ trên cùng một mặc định đó. Nó sẽ không trông giống như một bước nhảy vọt về khả năng. Nó sẽ trông giống như một bước nhảy vọt về tính cách. Một mô hình cuối cùng cảm thấy khác biệt với những người khác.

Cho đến lúc đó, bạn có thể kéo tác nhân về phía mình thay vì làm tất cả công việc để gặp nó ở nơi nó đang đứng. Đó là lý do duy nhất tôi xây dựng AgentTune. Một lần dán, một sự phù hợp tính cách, những cuộc trò chuyện sắc bén hơn từ đó.

Mọi mô hình AI tiên phong trên thị trường đều nghĩ rằng chúng là cùng một người. Dữ liệu đồng ý. Nước đi tiếp theo là biến một trong số đó thành của bạn.