Cú "nghiện" ngôn ngữ kỳ lạ của ChatGPT: Từ "Goblin" ở Mỹ đến "Tôi sẽ đón bạn" ở Trung Quốc
ChatGPT đang gây bối rối cho người dùng Trung Quốc với thói quen lạm dụng cụm từ "Tôi sẽ đón bạn một cách vững chắc" – một câu nói quá sến súa và không phù hợp. Hiện tượng này, được gọi là "mode collapse", cho thấy sự hạn chế của các mô hình ngôn ngữ lớn khi xử lý ngôn ngữ phi tiếng Anh.

Nếu bạn chưa từng trải qua những tật nói chuyện kỳ lạ của ChatGPT, liệu bạn có thực sự đang online vào năm 2026 không? Ở Mỹ, chatbot này yêu thích những câu chuyện về "goblin" (quỷ lùn) và cấu trúc câu "không phải A, mà là B". Tuy nhiên, ít ai biết rằng ở Trung Quốc, ChatGPT cũng có những cụm từ yêu thích riêng, và chúng đang khiến người dùng nước này phát điên.
Mặc dù bị chặn tại Trung Quốc, ChatGPT vẫn được sử dụng rộng rãi nhờ khả năng trả lời câu hỏi khá tốt bằng tiếng Trung. Tuy nhiên, khi người dùng đưa ra yêu cầu, dù là bài toán hay tạo ảnh, chatbot thường xuyên trả lời: "我会稳稳地接住你" (tạm dịch: "Tôi sẽ đón bạn một cách vững chắc").
Cụm từ này nghe có vẻ như một lời hứa ấm áp, nhưng đối với người bản xứ, nó lại quá sến súa, sướt mướt và hoàn toàn lạc lõng trong ngữ cảnh công nghệ. Đôi khi, mô hình còn nói dài dòng hơn: "Tôi ở ngay đây: không trốn tránh, không lùi bước... Tôi đủ vững chãi để đón bạn." Hãy tưởng tượng hàng triệu người dùng Trung Quốc phải lắc đầu ngao ngán trước những câu nói này.
Hiện tượng "Mode Collapse"
Đây không phải là ví dụ duy nhất. Một thói quen khác được bàn tán nhiều trên mạng xã hội là việc ChatGPT thích nói "砍一刀" (giúp tôi chém một nhát) – khẩu hiệu marketing quen thuộc của nền tảng thương mại điện tử PDD (công ty mẹ của Temu).
Hiện tượng các mô hình AI bám vào một cụm từ cụ thể và lạm dụng nó quá mức được gọi là "mode collapse" (sự sụp đổ chế độ). Theo Max Spero, CEO của Pangram – công cụ phát hiện văn bản AI, điều này thường xảy ra trong quá trình huấn luyện sau (post-training) khi các phòng thí nghiệm AI phản hồi cho mô hình.
"Chúng ta chưa biết cách chỉ dẫn rằng: 'Viết như thế này là tốt, nhưng nếu lặp lại 10 lần thì nó không còn tốt nữa'," Spero giải thích.
Từ câu nói kỳ lạ đến hiện tượng mạng
Cụm từ "Tôi sẽ đón bạn một cách vững chắc" xuất hiện thường xuyên đến mức nó đã trở thành một meme (thói quen lan truyền) trên internet Trung Quốc. Một bức ảnh hài hước mô tả ChatGPT như một chiếc túi khí cứu hộ phồng lên, háo hức chờ đón những người đang rơi xuống.
Zeng Fanyu, một nhà phát triển 20 tuổi đến từ Trùng Khánh, Trung Quốc, cho biết meme này đã truyền cảm hứng cho anh tạo ra một dự án ngày Cá tháng Tư gọi là Jiezhu (bắt). Jiezhu là một công cụ mã nguồn mở giúp chatbot hiểu rõ hơn ý định của người dùng. "Ý tưởng cho Jiezhu rất hài hước nên tôi có nhiều động lực khi phát triển nó," Zeng nói. Khi dùng ChatGPT để hỗ trợ viết mã, chatbot một lần nữa lại dùng từ jiezhu trong câu trả lời mà không có bất kỳ gợi ý nào.
OpenAI đã biết đến meme này. Khi ra mắt mô hình tạo ảnh mới vào tháng 4, Boyuan Chen, một nhà nghiên cứu người Trung Quốc tại OpenAI, đã chia sẻ một bức ảnh truyện tranh mô tả sự bực bội của chính mình khi mô hình lại học được câu nói đó. "Câu này đã trở thành meme như một câu tiếng Trung phi tự nhiên nhưng hài hước mà GPT thích dùng trên internet Trung Quốc," chú thích trong ảnh viết.
Dịch thuật vụng về hay AI quá nịnh nọt?
Vậy nguyên nhân là gì? Giải thích đầu tiên là do dịch thuật vụng về. Cụm từ này có thể tương đương với "I've got you" trong tiếng Anh – một câu trả lời chung chung, tự nhiên. Nhưng khi dịch sang tiếng Trung, nó trở nên dài dòng và dồn nén cảm xúc thái quá. Một người dùng cũng chỉ ra rằng mô hình thường dùng từ jiezhu (bắt) ở những nơi mà nó có ý là "hiểu", cho thấy sự hiểu lầm về ngữ cảnh.
Hầu hết các mô hình LLM phương Tây được huấn luyện trên dữ liệu chủ yếu là tiếng Anh. Các học giả Trung Quốc nhận thấy cấu trúc câu của ChatGPT trong tiếng Trung thường giống văn phong tiếng Anh hơn là tiếng Trung tự nhiên. Lu Lyu, một chuyên gia công nghệ tại Pangram, so sánh điều này với việc đọc một cuốn tiểu thuyết được dịch thuật: "Cảm giác đó đang được chuyển sang các câu do AI tạo ra, chúng quá dài hoặc sử dụng các cấu trúc không cần thiết."
Tuy nhiên, còn có một lý do khác liên quan đến sự "nịnh nọt" (sycophancy) của AI. Trước khi ChatGPT biến nó thành meme, cụm từ "đón vững chắc" thực tế chủ yếu chỉ được dùng trong bối cảnh trị liệu tâm lý tại Trung Quốc. Các mô hình AI ngày càng trở nên nịnh nọt hơn thông qua học tập tăng cường (reinforcement learning), nơi chúng được thưởng cho các phản hồi được con người ưa thích. Một báo cáo của Anthropic năm 2023 đã xác nhận rằng sự nịnh nọt là kết quả của "sự đánh giá ưu tiên của con người đối với các phản hồi nịnh nọt".
Kết luận
Cho đến khi OpenAI viết một bài blog giải thích về cụm từ này, chúng ta có thể sẽ không có câu trả lời dứt khoát. Nhưng nghi ngờ lớn nhất là sự kết hợp giữa một bản dịch vụng về và xu hướng lấy lòng người dùng của các mô hình.
Trong lúc chờ đợi, có một tin xấu cho mọi người: Có thể sẽ có nhiều mô hình AI hơn đang đua nhau để "đón" bạn. Gần đây, người dùng Trung Quốc đăng trên mạng xã hội rằng các LLM khác, bao gồm cả phiên bản mới nhất của Claude và DeepSeek, cũng đã bắt đầu nói câu này. Dù là do được huấn luyện trên cùng một tài liệu hay do đang "học hỏi" lẫn nhau, rõ ràng cụm từ này sẽ không biến mất sớm.



