Giải mã cơ chế hiển thị và theo dõi quảng cáo mới trên ChatGPT
OpenAI đã bắt đầu tích hợp quảng cáo vào ChatGPT thông qua việc chèn các đối tượng quảng cáo vào luồng phản hồi SSE. Bài viết phân tích chi tiết cách hệ thống này hoạt động, bao gồm việc sử dụng SDK OAIQ để theo dõi hành vi người dùng và vòng lặp phân bổ dựa trên các token mã hóa Fernet.
OpenAI đang âm thầm triển khai nền tảng quảng cáo của mình trực tiếp vào trải nghiệm ChatGPT, biến các cuộc hội thoại với AI thành một kênh tiếp thị mới. Thông qua việc phân tích lưu lượng mạng, cơ chế hoạt động phức tạp phía sau của hệ thống này đã được bóc tách, từ cách quảng cáo được chèn vào luồng văn bản cho đến cách theo dõi chuyển đổi của người dùng.
Cách quảng cáo xuất hiện trong cuộc hội thoại
Khi bạn gửi một tin nhắn đến ChatGPT, hệ thống backend sẽ mở một luồng phản hồi SSE (Server-Sent Events) tại điểm cuối chatgpt.com/backend-api/f/conversation. Phần lớn các sự kiện trong luồng này là dữ liệu đầu ra của mô hình ngôn ngữ, nhưng xen kẽ giữa chúng là các đơn vị quảng cáo.
Cụ thể, các quảng cáo này được định dạng là đối tượng single_advertiser_ad_unit. Đối tượng này chứa thông tin chi tiết về thương hiệu, bao gồm tên, URL, favicon, và các thẻ bài (carousel cards) hiển thị nội dung quảng cáo cùng hình ảnh minh họa. Đáng chú ý, tất cả các tài nguyên sáng tạo (creative assets) như hình ảnh quảng cáo và favicon đều được OpenAI lưu trữ trực tiếp trên máy chủ của họ tại miền bzrcdn.openai.com, thay vì tải từ máy chủ của nhà quảng cáo.
Một điểm quan trọng trong cơ chế này là tham số open_externally: false. Điều này có nghĩa là khi người dùng nhấp vào quảng cáo, liên kết sẽ không mở trong trình duyệt mặc định mà sẽ mở trong chế độ xem web tích hợp (in-app webview) của ChatGPT. Điều này cho phép OpenAI quan sát hành điều hướng sau khi nhấp chuột, thu thập thêm dữ liệu tín hiệu (pixel signal) vượt ra ngoài khả năng theo dõi thông thường.
Nhắm mục tiêu theo ngữ cảnh
Dựa trên dữ liệu quan sát từ một tài khoản thử nghiệm, hệ thống quảng cáo của ChatGPT dường như hoạt động dựa trên ngữ cảnh của cuộc trò chuyện hiện tại. Các quảng cáo được phục vụ thay đổi tùy theo chủ đề thảo luận:
- Khi lập kế hoạch du lịch đến Bắc Kinh (Cửu Thành Cung, Vạn Lý Trường Thành), người dùng nhận được quảng cáo đồ ăn Trung Quốc từ Grubhub hoặc tour du lịch từ GetYourGuide.
- Khi thảo luận về vé máy bay đến Bắc Kinh, quảng cáo từ hãng Axel xuất hiện.
- Chủ đề về NBA Playoffs mang lại quảng cáo vé xem bóng rổ từ Gametime.
- Các chủ đề về thời trang hoặc năng suất làm việc lần lượt dẫn đến quảng cáo từ các thương hiệu thời trang Aritzia và công cụ thiết kế Canva.
Cơ chế này cho thấy OpenAI đang tận dụng khả năng hiểu ngữ cảnh của mô hình AI để phân phối quảng cáo phù hợp, dù vẫn chưa rõ liệu lịch sử hội thoại trong quá khứ có được sử dụng để nhắm mục tiêu hay không.
Chuỗi phân bổ với 4 token mã hóa
Để đảm bảo tính toàn vẹn và theo dõi hiệu quả quảng cáo, mỗi đơn vị quảng cáo đi kèm với 4 khối dữ liệu được mã hóa bằng Fernet (một dạng mã hóa đối xứng sử dụng AES-128-CBC với HMAC-SHA256 để kiểm tra tính toàn vẹn). Bốn token này bao gồm:
- ads_spam_integrity_payload: Được gửi trong dữ liệu SSE nhưng không xuất hiện trên URL nhấp chuột. Token này dùng để kiểm tra tính toàn vẹn phía máy chủ nhằm chống lại các hành vi giả mạo nhấp chuột (click fraud).
- oppref: Xuất hiện trên URL nhấp chuột và được SDK sao chép vào cookie
__oppref(có thời hạn sống 720 giờ hoặc 30 ngày). Đây là token phân bổ chuyển tiếp (forward attribution), đi kèm mọi sự kiện pixel sau đó của nhà bán hàng. - olref: Đi kèm với
oppreftrên URL nhưng không được lưu trữ bởi SDK quan sát được. Token này có khả năng dùng để ghi log tham chiếu liên kết đầu ra (outbound-link-reference) phía máy chủ. - ad_data_token: Là JSON được bọc trong base64 chứa một token Fernet khác, được mang trong tải trọng SSE và đối chiếu phía máy chủ tại thời điểm nhấp chuột.
Vì Fernet sử dụng 9 byte đầu tiên công khai (1 byte phiên bản và 8 byte dấu thời gian Unix), nên có thể khôi phục thời gian tạo (mint time) của các token này mà không cần khóa bí mật của OpenAI. Điều này cho phép các nhà nghiên cứu tính toán độ trễ từ lúc quảng cáo được tạo đến khi người dùng nhấp vào.
Vòng lặp theo dõi phía người bán
Khi người dùng nhấn vào một thẻ quảng cáo, trình duyệt sẽ mở một URL chứa các tham số theo dõi như utm_source và các token oppref, olref. Tại trang của người bán (merchant), một SDK theo dõi có tên là OAIQ sẽ được tải.
Phiên bản hiện tại của SDK này là 0.1.3. Khi khởi tạo, nó đọc tham số oppref từ window.location, ghi giá trị này vào cookie bên thứ nhất __oppref và đặt một cookie thăm dò tên là __oaiq_domain_probe. Mọi lệnh gọi đo lường sau đó (measure calls) sẽ gửi dữ liệu JSON về máy chủ của OpenAI tại bzr.openai.com.
Để chặn các sự kiện quảng cáo từ ChatGPT, người dùng có thể thêm hai miền bzrcdn.openai.com và bzr.openai.com vào danh sách bộ lọc (filter list) của trình chặn quảng cáo, đồng thời kiểm tra hai cookie __oppref và __oaiq_domain_probe sau khi nhấp vào bất kỳ liên kết nào do ChatGPT gợi ý.
Bài viết liên quan
Công nghệ
RLSD: Phương pháp mới giúp xây dựng AI suy luận tùy chỉnh với chi phí tính toán thấp hơn
28 tháng 4, 2026

Công nghệ
Elon Musk khai nhận tại tòa: Mối thù với Larry Page là động lực thành lập OpenAI
29 tháng 4, 2026

Công nghệ
Elon Musk tỏ ra lúng túng và thiếu chuẩn bị trong phiên tòa kiện OpenAI
28 tháng 4, 2026
