Cơ chế trích dẫn của công cụ tìm kiếm AI: Những yếu tố thực sự quyết định
Nghiên cứu mới cho thấy sự khác biệt lớn giữa Google và ChatGPT trong việc xếp hạng kết quả, khiến chiến lược SEO truyền thống trở nên kém hiệu quả. Để tối ưu hóa cho AI (GEO), yếu tố quan trọng nhất là mật độ dữ liệu, uy tín và tính mới của nội dung thay vì từ khóa.

Google và ChatGPT dường như không có nhiều điểm chung khi quyết định ai xứng đáng có thứ hạng cao.
Một nghiên cứu của Chatoptic năm 2025 đã kiểm tra 1.000 truy vấn tìm kiếm trên 15 thương hiệu và chỉ tìm thấy 62% sự trùng lặp giữa kết quả trang đầu của Google và các nguồn được trích dẫn bởi ChatGPT. Hệ số tương quan giữa thứ hạng Google và độ hiển thị trên ChatGPT là bao nhiêu? Chỉ có 0,034 — gần như bằng không.
Điều này có nghĩa là cẩm nang SEO truyền thống của bạn không còn đủ nữa. Các công cụ tìm kiếm AI — ChatGPT, Perplexity, Gemini, Google AI Overviews — sử dụng các tín hiệu xếp hạng hoàn toàn khác biệt. Và với báo cáo từ Bain cho thấy 80% người dùng tìm kiếm hiện nay dựa vào các tóm tắt của AI ít nhất 40% thời gian, đây không còn là một vấn đề nhỏ.
Tôi đã dành vài tháng qua để phân tích mọi nghiên cứu lớn về hành vi trích dẫn của các công cụ tìm kiếm AI. Dưới đây là những gì dữ liệu thực sự cho thấy.
Nghiên cứu quy mô lớn nhất: Phân tích 129.000 tên miền
SE Ranking và Search Engine Journal đã công bố phân tích toàn diện nhất về các mô hình trích dẫn của ChatGPT tính đến nay — bao gồm 129.000 tên miền, 216.524 trang, trải dài trên 20 lĩnh vực ngành nghề.
Những phát hiện chính của họ:
| Tín hiệu | Tác động đến lượt trích dẫn của AI |
|---|---|
| Trích dẫn chuyên gia trong nội dung | 4,1 vs 2,4 trích dẫn (+71%) |
| 19+ điểm dữ liệu thống kê | 5,4 vs 2,8 trích dẫn (+93%) |
| Bài viết dài hơn 2.900 từ | 5,1 vs 3,2 trích dẫn (+59%) |
| Nội dung được cập nhật trong 3 tháng | 6,0 vs 3,6 trích dẫn (+67%) |
| 350K+ tên miền trỏ về (backlink) | 8,4 vs 1,6 trích dẫn (+425%) |
| Dữ liệu có cấu trúc + Schema FAQ | +44% trích dẫn AI nhiều hơn |
Bài học rút ra: Mật độ dữ liệu và tín hiệu uy tín quan trọng hơn nhiều so với tối ưu hóa từ khóa.
ChatGPT chỉ trích dẫn khoảng 15% số trang mà nó truy xuất. Top 10 tên miền chiếm tới 46% tất cả các trích dẫn. Nếu nội dung của bạn không nổi bật với dữ liệu có thể kiểm chứng và uy tín chuyên môn, nó sẽ bị bỏ qua.
Nghiên cứu nền tảng về GEO (10.000 truy vấn)
Thuật ngữ "Generative Engine Optimization" (Tối ưu hóa công cụ tạo sinh) xuất phát từ một bài báo học thuật của Aggarwal và cộng sự được trình bày tại KDD 2024 (hội nghị khai phá dữ liệu hàng đầu). Các nhà nghiên cứu từ Đại học Princeton và IIT Delhi đã kiểm tra 10.000 truy vấn trên 9 lĩnh vực để đo lường điều gì thực sự cải thiện độ hiển thị trong các phản hồi do AI tạo ra.
Kết quả của họ:
| Kỹ thuật tối ưu hóa | Thay đổi độ hiển thị |
|---|---|
| Thêm trích dẫn từ chuyên gia | +41% |
| Thêm số liệu thống kê có nguồn | +33% (+37% trên Perplexity) |
| Trích dẫn các nguồn uy tín | +30% (+115% cho các site hạng thấp) |
| Cải thiện sự trôi chảy | +28% |
| Sử dụng thuật ngữ kỹ thuật | +18% |
| Nhồi nhét từ khóa | -10% (gây hại) |
Con số +115% cho việc trích dẫn nguồn ở các web hạng thấp là phát hiện thú vị nhất. Điều này có nghĩa là các trang web nhỏ được hưởng lợi phi tỷ lệ từ việc dẫn nguồn — các mô hình AI thưởng cho hành vi trích dẫn mạnh mẽ hơn khi chính tên miền đó chưa phải là một uy tín lớn.
Ai được trích dẫn? Phân bố quyền lực rất khốc liệt
BrightEdge phát hiện ra rằng top 50 thương hiệu chiếm 28,9% tổng số lượt nhắc đến của AI, trong khi 26% thương hiệu không nhận được bất kỳ độ hiển thị AI nào.
Tuy nhiên, vấn đề không chỉ nằm ở quy mô thương hiệu. Nguồn trích dẫn khác với những gì bạn mong đợi:
- Wikipedia: 47,9% trích dẫn của ChatGPT (Aggarwal et al.)
- Reddit: 46,7% trích dẫn của Perplexity
- Website sở hữu thương hiệu: Chỉ chiếm 5-10% nguồn AI (McKinsey, tháng 8/2025)
Số liệu cuối cùng là hồi chuông cảnh tỉnh. Hơn 90% nguồn tìm kiếm AI đến từ các nhà xuất bản, nội dung do người dùng tạo và nền tảng đánh giá — không phải từ chính website của bạn.
Điều này có nghĩa là sự hiện diện ngoài site (off-site) của bạn cực kỳ quan trọng. Các cuộc thảo luận trên diễn đàn, đánh giá của bên thứ ba, bài viết khách trên các ấn phẩm uy tín — những thứ này "nuôi" các mô hình AI nhiều hơn blog của chính bạn.
Tính mới của nội dung: Cửa sổ 30 ngày
Một trong những phát hiện khả thi nhất: Phân tích của Digital Bloom trên hơn 7.000 lượt trích dẫn AI nhận thấy rằng nội dung được cập nhật trong vòng 30 ngày nhận được 3,2 lần lượt trích dẫn AI nhiều hơn.
Seer Interactive cũng xác nhận điều này — 71% trích dẫn của ChatGPT đến từ nội dung được xuất bản từ năm 2023-2025, với 31% chỉ từ nội dung năm 2025.
Hàm ý thực tế: nếu bạn viết một bài kỹ thuật tuyệt vời vào năm 2022 và chưa chạm tới nó kể từ đó, các công cụ tìm kiếm AI có thể đang bỏ qua nó. Ngay cả những bản cập nhật nhỏ — làm mới số liệu thống kê, thêm các ví dụ gần đây, cập nhật ngày tháng — có thể cải thiện đáng kể khả năng được trích dẫn.
Sự khác biệt về tỷ lệ chuyển đổi là có thật
Vậy liệu điều này có quan trọng đối với kết quả kinh doanh không?
- Seer Interactive theo dõi giới thiệu từ ChatGPT trong 7 tháng: tỷ lệ chuyển đổi 15,9% so với 1,76% của Google organic (cao gấp 9 lần).
- Similarweb tìm thấy tỷ lệ chuyển đổi từ giới thiệu AI là 11,4% so với 5,3% của tìm kiếm organic.
- Ahrefs báo cáo lượng truy cập tìm kiếm AI = 0,5% tổng traffic nhưng lại tạo ra 12,1% lượng đăng ký.
Lượng truy cập từ tìm kiếm AI nhỏ về mặt số lượng nhưng cực kỳ cao về ý định (intent). Những người hỏi các mô hình AI để được giới thiệu ở giai đoạn sâu hơn trong phễu mua hàng so với những người gõ các truy vấn chung chung trên Google.
Nhà phát triển nên làm gì?
Dựa trên nghiên cứu, đây là những điều thực sự có tác động:
1. Thêm dữ liệu vào mọi thứ bạn xuất bản
Dữ liệu của SE Ranking rất rõ ràng: các trang có 19+ điểm dữ liệu thống kê nhận được gần gấp đôi lượt trích dẫn AI. Đừng viết "hiệu suất được cải thiện đáng kể" — hãy viết "độ trễ P95 giảm từ 340ms xuống 89ms sau khi chuyển sang connection pooling".
2. Trích dẫn chuyên gia (hoặc là chuyên gia được trích dẫn)
Trích dẫn chuyên gia trong nội dung = +71% trích dẫn nhiều hơn. Nếu bạn đang viết một bài kỹ thuật, hãy trích dẫn tên tác giả của nguồn đó. Nếu bạn đang xây dựng một dự án, hãy cố gắng được trích dẫn trong nội dung của người khác.
3. Cập nhật nội dung mỗi 30 ngày
Sự gia tăng 3,2 lần lượt trích dẫn cho nội dung mới cập nhật là đòn bẩy dễ kéo nhất. Đặt lời nhắc lịch để làm mới các trang quan trọng của bạn hàng tháng.
4. Xây dựng sự hiện diện ngoài site
Với hơn 90% nguồn AI là nội dung của bên thứ ba, blog của riêng bạn là cần thiết nhưng chưa đủ. Góp sức trên Stack Overflow, viết trên Dev.to, được nhắc đến trong các bài viết tổng hợp, kiếm được cuộc thảo luận trên Reddit.
5. Sử dụng dữ liệu có cấu trúc
Schema FAQ, bảng so sánh và mã đánh dấu cách thực hiện (how-to) làm tăng tỷ lệ trích dẫn AI từ 40-44%. Đây là các triển khai một lần mang lại lợi nhuận gộp theo thời gian.
6. Đừng nhồi nhét từ khóa
Nghiên cứu GEO cho thấy nhồi nhét từ khóa giảm độ hiển thị đi 10%. Các mô hình AI phạt nội dung tối ưu hóa cho trình thu thập dữ liệu (crawler) thay vì người đọc.
Kiểm tra độ hiển thị AI của chính bạn
Chúng tôi đã xây dựng Foglift để giúp chính xác việc này — đó là một công cụ miễn phí kiểm tra trang web của bạn về cả SEO truyền thống và sự sẵn sàng cho tìm kiếm AI (điểm GEO/AEO). Quá trình quét kiểm tra dữ liệu có cấu trúc, tín hiệu nội dung, khả năng được trích dẫn và đưa cho bạn kế hoạch hành động được ưu tiên.
Chúng tôi tự sử dụng sản phẩm của mình — chúng tôi chạy Foglift trên chính foglift.io và sử dụng các khuyến nghị để cải thiện nội dung của chính mình. Lần kiểm toán gần nhất của chúng tôi: SEO 100, GEO 100, AEO 88 (vẫn đang cố gắng hoàn thiện mục cuối cùng).
Nguồn:
- Aggarwal, P. et al. "GEO: Generative Engine Optimization." KDD 2024 (Princeton/IIT Delhi). arxiv.org/abs/2311.09735
- SE Ranking / Search Engine Journal. "ChatGPT Citation Analysis: 129K Domains." 2025.
- Chatoptic. "Google vs ChatGPT Visibility Study: 1,000 Queries." 2025.
- Seer Interactive. "ChatGPT Citation Freshness & Conversion Analysis." 2025.
- Digital Bloom. "AI Citation Patterns: 7,000+ Citations Analyzed." 2025.
- BrightEdge. "AI Brand Mention Distribution Study." 2025.
- McKinsey. "AI Discovery Survey: 1,927 Consumers." August 2025.
- Bain & Company. "AI Search User Behavior Report." 2025.
Watson là quản lý sản phẩm tại Foglift, đang xây dựng các công cụ cho độ hiển thị tìm kiếm AI.



