Cách DoorDash kết hợp LLM để tạo ra cá nhân hóa động và siêu sâu cho người dùng

Sudeep Das và Pradeep Muthukrishnan chia sẻ về việc chuyển đổi từ bán hàng tĩnh sang cá nhân hóa động tại DoorDash. Họ sử dụng LLM để tạo hồ sơ người dùng và kế hoạch nội dung, trong khi học sâu truyền thống xử lý việc xếp hạng. Phương pháp lai này giúp nền tảng thích ứng nhanh chóng với ý định ngắn hạn của người dùng.

Trong bài thuyết trình tại hội nghị QCon, Sudeep Das (Trưởng bộ phận Máy học và AI) và Pradeep Muthukrishnan (Trưởng bộ phận Tăng trưởng mảng kinh doanh mới) của DoorDash đã đi sâu vào hành trình tái định hình khái niệm cá nhân hóa. Họ không chỉ dừng lại ở việc gợi ý món ăn dựa trên lịch sử, mà còn hướng tới "siêu cá nhân hóa" (hyper-personalization), nơi hệ thống hiểu và đáp ứng nhu cầu của người dùng trong từng khoảnh khắc cụ thể.

Từ sự phong phú đến thách thức về lựa chọn

DoorDash đã phát triển từ một ứng dụng giao đồ ăn thành nền tảng thương mại địa phương, cung cấp mọi thứ từ tạp hóa, hoa tươi, dược phẩm đến đồ điện tử. Tuy nhiên, sự mở rộng này mang lại một thách thức lớn: sự dư thừa (abundance). Khi có hàng triệu người dùng, hàng ngàn nhà bán hàng và một danh mục sản phẩm khổng lồ, việc tìm ra đúng sản phẩm mà khách hàng cần tại đúng thời điểm trở nên khó khăn hơn bao giờ hết.

Hệ thống cá nhân hóa cổ điển (như mô hình hóa ma trận, collaborative filtering) thường dựa vào hành vi dài hạn. Chúng hoạt động tốt với các sở thích ổn định nhưng thất bại trong việc nắm bắt các "khoảnh khắc động" — những nhu cầu ngắn hạn, thay đổi nhanh chóng. Ví dụ: nhu cầu ăn khuya lúc 2 giờ sáng, mua thuốc khi bị cúm, hoặc săn sale tai nghe vào ngày Black Friday.

Tại sao cá nhân hóa tĩnh không còn hiệu quả

Cá nhân hóa tĩnh hoặc các chiến lược merchandising cũ thường chỉ học từ sở thích dài hạn và khó phản ứng kịp thời với sự thay đổi hành vi của người dùng. Hơn nữa, các hệ thống này thường thiếu "kiến thức thế giới" (world knowledge). Nếu DoorDash vừa thêm một nhà bán hàng mới như Best Buy và chưa có dữ liệu tương tác, hệ thống cũ sẽ khó gợi ý sản phẩm phù hợp.

Đây là lúc Mô hình Ngôn ngữ Lớn (LLM) phát huy tác dụng. LLM sở hữu kiến thức rộng lớn về thế giới và khả năng lý luận ngữ nghĩa, cho phép hệ thống hiểu sản phẩm và người dùng sâu hơn nhiều so với các phương pháp truyền thống.

Kết hợp LLM và Học sâu truyền thống

DoorDash đã áp dụng phương pháp lai, kết hợp sức mạnh của LLM và Học sâu (Deep Learning) truyền thống:

LLM: Được sử dụng để tạo ra các "hồ sơ người dùng" dưới dạng ngôn ngữ tự nhiên và các bản thiết kế nội dung (content blueprints). LLM giúp chuyển đổi hành vi lộn xộn của người dùng thành những câu chuyện dễ hiểu, giải thích được lý do đằng sau các gợi ý.
Học sâu truyền thống: Vẫn đóng vai trò then chốt trong việc xếp hạng (ranking) và truy xuất (retrieval) ở giai đoạn cuối nhờ tốc độ xử lý nhanh và độ trễ thấp.

Mục tiêu là chuyển dịch từ câu chuyện "Những người giống bạn thích món X" sang "Bạn cần món X ngay bây giờ".

Hiểu sản phẩm và Người dùng sâu hơn

Hiểu sản phẩm với AI

Một bước tiến lớn của DoorDash là chuyển từ quy trình do con người điều hành sang hệ thống dẫn động bởi AI để hiểu sản phẩm. Trước đây, việc trích xuất thuộc tính sản phẩm (thương hiệu, hương vị, chất gây dị ứng...) mất 28 ngày. Nay, nhờ LLM tinh chỉnh (fine-tuning) và quy trình RAG (Retrieval-Augmented Generation), thời gian này rút xuống còn 2 ngày.

Hệ thống thậm chí sử dụng các quy trình tác nhân (agentic processes) để tìm kiếm thông tin trên Google hoặc website của nhà bán hàng khi dữ liệu đầu vào quá sơ sài từ các cửa hàng nhỏ, giúp giải quyết bài toán onboarding nhà bán hàng mới một cách tự động.

Hồ sơ người dùng bằng ngôn ngữ tự nhiên

Thay vì chỉ sử dụng các vector đặc trưng hay embeddings (vector nhúng) khó giải thích, DoorDash bắt đầu lưu trữ hồ sơ người dùng dưới dạng văn bản thuần túy bằng tiếng Anh. Ví dụ: "Alice thường mua đồ điện tử vào phút chót nhưng lại quan tâm đến tai nghe chụp tai chống ồn cao cấp...".

Cách tiếp cận này không chỉ giúp hệ thống dễ hiểu sở thích của người dùng mà còn giúp giải thích gợi ý cho chính người dùng đó, từ đó tăng mức độ tương tác.

Kiến trúc Hậu cần và Trực tuyến

Để tối ưu hóa hiệu suất và chi phí, DoorDash tách biệt việc xử lý ngoại tuyến (offline) và trực tuyến (online):

Ngoại tuyến (Offline): LLMs chạy để tạo ra các cấu hình cá nhân hóa cho từng người dùng (ví dụ: danh sách các carousel gợi ý cho tuần tới). Quá trình này tốn thời gian nhưng không ảnh hưởng đến trải nghiệm người dùng thực.
Trực tuyến (Online): Khi người dùng mở ứng dụng, hệ thống sử dụng các mô hình ML truyền thống và embeddings để điền nội dung vào các cấu hình đó dựa trên tồn kho thời gian thực, vị trí địa lý và ý định hiện tại của người dùng.

Đánh giá và Bài học kinh nghiệm

Việc đánh giá hệ thống cá nhân hóa mới này rất khó khăn vì mỗi người dùng nhìn thấy một giao diện hoàn toàn khác nhau. DoorDash sử dụng khung GEPA (Genetic-Pareto) để tối ưu hóa các hệ thống AI phức hợp này, kết hợp phản hồi từ con người, LLM đóng vai trò giám khảo (LLM-as-a-judge) và các số liệu định lượng.

Những bài học chính từ quá trình này bao gồm:

Đừng vứt bỏ các mô hình học sâu truyền thống; chúng vẫn xuất sắc trong việc xếp hạng và tối ưu hóa các chỉ số cụ thể.
LLMs tỏa sáng trong việc chuyển đổi hành vi hỗn loạn thành các tường thuật ngôn ngữ tự nhiên dễ hiểu.
Hãy coi việc tích hợp LLM và ML là công việc sản phẩm (product work) chứ không chỉ là hạ tầng (infra work).
Đầu tư vào các nguyên khối chia sẻ (shared primitives) như hồ sơ người dùng và đồ thị sản phẩm để có thể tái sử dụng trên nhiều ứng dụng khác nhau.

Bằng cách kết hợp trí tuệ của LLM với hiệu quả của học sâu truyền thống, DoorDash đang tạo ra những trải nghiệm "ma thuật" nơi ứng dụng thực sự hiểu và đáp ứng nhu cầu của người dùng trong từng khoảnh khắc cụ thể.

Cách DoorDash kết hợp LLM để tạo ra cá nhân hóa động và siêu sâu cho người dùng

Từ sự phong phú đến thách thức về lựa chọn

Tại sao cá nhân hóa tĩnh không còn hiệu quả

Kết hợp LLM và Học sâu truyền thống

Hiểu sản phẩm và Người dùng sâu hơn

Hiểu sản phẩm với AI

Hồ sơ người dùng bằng ngôn ngữ tự nhiên

Kiến trúc Hậu cần và Trực tuyến

Đánh giá và Bài học kinh nghiệm

Bài viết liên quan