Phân tích nguyên nhân khách hàng rời bỏ khi hết hạn: Do giá cả hay do dự án?

Phần mềm08 tháng 5, 2026·11 phút đọc

Bài viết hướng dẫn thực tế về quy trình suy luận nhân quả khi hai yếu tố gây rời bỏ khách hàng (churn) tác động cùng lúc. Khám phá cách sử dụng Difference-in-Differences, Hồi quy tương tác và Giá trị Shapley để xác định chính xác nguyên nhân là do tăng giá hay do giá trị dự án đã hết.

Phân tích nguyên nhân khách hàng rời bỏ khi hết hạn: Do giá cả hay do dự án?

Phân tích nguyên nhân khách hàng rời bỏ khi hết hạn: Do giá cả hay do dự án?

Quyết định về giá cả khi gia hạn hợp đồng thường dường như rất đơn giản cho đến khi bạn phải đo lường nó. Mức giá ưu đãi ban đầu của khách hàng hết hạn, hóa đơn tăng lên, và bạn muốn biết liệu sự thay đổi về giá này có ảnh hưởng xấu đến khả năng giữ chân khách hàng hay không. Về lý thuyết thì có vẻ đơn giản.

Tuy nhiên, vấn đề là hầu như luôn có một yếu tố nào đó khác xảy ra cùng lúc. Sáng kiến thúc đẩy đơn hàng ban đầu, dù là di chuyển hệ thống, tuân thủ quy định, chuyển đổi số hay ra mắt sản phẩm, đã kết thúc. Đội ngũ từng ủng hộ công cụ này đã chuyển sang việc khác. Và sản phẩm từng cảm thấy cần thiết này đang dần trở thành một khoản mục chi tiêu mà ai đó sẽ bắt đầu đặt câu hỏi.

Vì vậy, khi khách hàng rời bỏ (churn), đội ngũ quản lý tài khoản nói rằng là do giá. Đội ngũ chiến lược giữ chân khách hàng nói rằng trường hợp sử dụng (use case) đã hết hạn sử dụng. Bộ phận Sản phẩm cho rằng nền tảng chưa bao giờ vượt qua được người mua ban đầu. Ai cũng có một lý thuyết và một bảng tính để chứng minh.

Việc bạn quy kết nguyên nhân cho đâu là rất quan trọng, không chỉ trên lý thuyết, mà còn ở việc bạn sẽ làm gì tiếp theo.

  • Nếu nguyên nhân chính là Hết hạn ưu đãi (giá sốc): Gia hạn giảm giá, thiết kế lại gói gia hạn, điều chỉnh thang giá.
  • Nếu nguyên nhân chính là Hoàn thành sáng kiến (giá trị cạn kiệt): Đầu tư vào các trường hợp sử dụng mở rộng, kích hoạt các kịch bản giữ chân theo vòng đời, cải thiện quá trình tích hợp vào quy trình làm việc định kỳ.
  • Cả hai lực lượng tương tác: Lên lịch các ưu đãi gia số xung quanh các mốc kinh doanh mới; chỉ giảm giá sẽ không giải quyết được vấn đề về giá trị.

Phân tích tỷ lệ rời bỏ theo các điều kiện khác nhauPhân tích tỷ lệ rời bỏ theo các điều kiện khác nhau

Mỗi phương pháp dưới đây sẽ xây dựng một kịch bản phản sự thực (counterfactual) khác cho cùng một sự kiện. Việc chọn đúng phương pháp không phải là phần khó nhất. Điều khó nhất là biết bạn đang cố gắng trả lời câu hỏi gì trước khi bắt đầu mở máy tính ra phân tích. Đó là nơi hầu hết các phân tích này đi sai hướng.

Xác định câu hỏi trước phương pháp

Trước khi chạm vào dữ liệu, bạn cần quyết định những gì bạn thực sự đang cố gắng ước lượng. Cùng một sự kiện rời bỏ ở thời điểm gia hạn có thể cho ra ba con số có ý nghĩa khác nhau tùy thuộc vào câu hỏi bạn đặt:

  1. Hiệu ứng nhóm ưu đãi (Promo-cohort effect): Tác động trung bình của việc hết hạn ưu đãi đối với tỷ lệ rời bỏ là bao nhiêu? Đội ngũ tài chính thường muốn con số này vì nó liên quan đến cách báo cáo doanh thu gia hạn.
  2. Hiệu ứng hoàn thành sáng kiến (Initiative-completion effect): Tác động của việc kết thúc trường hợp sử dụng ban đầu đến tỷ lệ rời bỏ là bao nhiêu? Đội ngũ chiến lược giữ chân khách hàng muốn con số này vì nó cho biết sản phẩm có tạo ra giá trị dính kết (sticky value) hay chỉ phục vụ một dự án nhất thời.
  3. Hiệu ứng kết hợp và sự tương tác (Joint effect and interaction): Điều gì xảy ra với những khách hàng phải đối mặt với cả hai yếu tố cùng lúc, khi tăng giá và sự cạn kiệt giá trị cùng đến? Con số này hầu như luôn lớn hơn dự đoán của bất kỳ lực lượng nào đơn lẻ, và thường là yếu tố thực sự giải thích đợt rời bỏ tăng vọt.

Đây không phải là cùng một con số và chúng không trả lời cùng một câu hỏi. Việc coi chúng giống hệt nhau là sai lầm phổ biến nhất tôi thấy trong các phân tích tỷ lệ rời bỏ khi gia hạn, và thường là lý do khiến tranh luận giữa đội ngũ tài khoản và đội ngũ chiến lược giữ chân đi vào ngõ cụt.

Cài đặt dữ liệu

Bộ dữ liệu tổng hợp bao gồm 10.000 khách hàng B2B được quan sát xung quanh ngày gia hạn của họ. Mỗi người có hai cờ đánh dấu: promo_expired (mức giá khởi điểm có hết hạn vào lúc gia hạn không?) và initiative_complete (trường hợp sử dụng ban đầu đã kết thúc trước khi gia hạn chưa?).

Một điều đáng lưu ý ngay từ đầu: initiative_complete cần được định nghĩa bằng các tín hiệu trước khi gia hạn, như các cột mốc trong CRM (quản lý quan hệ khách hàng), hoàn thành triển khai hoặc điểm sức khỏe của thành công khách hàng. Nếu bạn suy luận nó từ mức sử dụng giảm sút sau sự việc, bạn sẽ kết luận hành vi rời bỏ sớm là nguyên nhân của việc rời bỏ thay vì là một triệu chứng.

Các hiệu ứng thực tế được đưa vào mô phỏng:

  • Tỷ lệ rời bỏ cơ bản 6 tháng (không có lực lượng nào): 8%
  • Chỉ hết hạn ưu đãi: +5 điểm phần trăm (tỷ lệ rời bỏ 13%)
  • Chỉ hoàn thành sáng kiến: +4 điểm phần trăm (tỷ lệ rời bỏ 12%)
  • Cả hai lực lượng cùng lúc: +14 điểm phần trăm (tỷ lệ rời bỏ 22%), dư thừa tương tác +5 điểm phần trăm so với kỳ vọng cộng thêm là 17%.

Phương pháp 1: Difference-in-Differences (DiD)

Câu hỏi kinh doanh: Tác động của việc hết hạn ưu đãi lên tỷ lệ rời bỏ là bao nhiêu, so với nhóm đối chứng chưa gia hạn?

Ước lượng cụ thể: Hệ số post:A trong mô hình DiD thuần túy, hoặc hệ số tương tác ba chiều post:A:B để xem liệu cú sốc giá có tồi tệ hơn khi sáng kiến kết thúc hay không.

Giả định nhận dạng: Xu hướng song song (parallel trends). Nếu không có sự kiện hết hạn, nhóm bị ảnh hưởng và nhóm đối chứng sẽ có cùng đường đi về tỷ lệ rời bỏ.

Mô hình DiD có thể được viết như sau:

# Biến đổi dữ liệu thành dạng bảng theo tuần
panel = customers.melt(
    id_vars=['customer_id', 'promo_expired', 'initiative_complete'],
    value_vars=['pre', 'post'],
    var_name='post',
    value_name='churned'
)
panel['A'] = panel['promo_expired'] # đổi tên cho rõ nghĩa
panel['B'] = panel['initiative_complete']

# 'post * A * B' mở rộng thành: post, A, B, post:A, post:B, A:B, post:A:B.
# Trọng số by at_risk cho các tuần-cohort lớn hơn có tầm ảnh hưởng hơn.
did_model = smf.wls(
    'churned ~ post * A * B',
    data = panel,
    weights = panel['at_risk'],
).fit(cov_type='HC3') # sai số robust lấy phương sai không đồng nhất

Biểu đồ nghiên cứu sự kiện kiểm tra giả định xu hướng song songBiểu đồ nghiên cứu sự kiện kiểm tra giả định xu hướng song song

Đọc kết quả: Hệ số tương tác ba chiều, post:A:B, là đích đến của thiết lập này. Một hệ số dương ở đó có nghĩa là cú sốc giá gây tác động mạnh hơn khi trường hợp sử dụng đã phai nhạt. Nếu bạn thấy điều này, hóa đơn gia nhập giảm giá sẽ không thể giải quyết được vấn đề.

Phương pháp 2: Hồi quy với các hệ số tương tác (Interaction Terms)

Câu hỏi kinh doanh: Hiệu ứng riêng biệt của việc tăng giá và hoàn thành dự án là gì, và chúng có tương tác với nhau không?

Ước lượng cụ thể: Các hiệu ứng chính và hệ số tương tác từ mô hình hồi quy mô tả rõ ràng cả hai lực lượng và hệ số chung của chúng.

Giả định nhận dạng: Không có nhân tử gây nhiễu chưa đo lường, độ chồng lấn đủ tốt qua cả bốn điều kiện, dạng hàm được chỉ định chính xác.

# Hồi quy cấp độ khách hàng. Kết quả: 1 nếu khách hàng rời bỏ trong vòng 6 tháng.
# np.log1p(x) = log(1 + x); dùng để kiểm soát các biến hiệp biến bị lệch
# (doanh thu hàng năm, số lượng ghế) để vài khách hàng lớn không chi phối.
# Toán tử * dưới đây mở rộng thành: các hiệu ứng chính của A và B VÀ tương tác của chúng.
interaction_model = smf.ols(
    'churned ~ promo_expired * initiative_complete'
    '       + np.log1p(arr_usd) + np.log1p(n_seats)',
    data=customers,
).fit(cov_type='HC3')

Một điều khiến người ta dễ mắc sai lầm: b1 không phải là "hiệu ứng của việc hết hạn ưu đãi". Nó là hiệu ứng khi initiative_complete bằng 0. Một khi sáng kiến cũng đã kết thúc, hiệu ứng cận biên của việc hết hạn ưu đãi là b1 + b3, trong đó b3 là hệ số tương tác.

Hiệu ứng tương tác giữa giá và hoàn thành dự ánHiệu ứng tương tác giữa giá và hoàn thành dự án

Đọc kết quả: Hệ số tương tác này lớn bằng bất kỳ hiệu ứng chính nào. Một khách hàng phải đối mặt với cả hai lực lượng không chỉ là có rủi ro cao hơn, mà họ đang ở trong một tình huống cơ bản khác biệt. Đó là điều nên thúc đẩy phản ứng thương mại.

Phương pháp 3: Quy kết giá trị Shapley (Shapley Value Attribution)

Câu hỏi kinh doanh: Cả hai lực lượng cùng gây ra 14 điểm phần trăm rời bỏ tăng thêm, thì mỗi lực lượng phải chịu trách nhiệm bao nhiêu cho mục đích phân bổ ngân sách và chiến lược gia hạn?

Ước lượng cụ thể: Phân bổ công bằng tác động rời bỏ chung giữa hai lực lượng nhân quả, sử dụng giá trị Shapley từ lý thuyết trò chơi hợp tác.

Giả định nhận dạng: Các ước lượng giá trị liên minh v(S), trong đó S là tập con các tài xế và v(S) là lượng rời bỏ tăng thêm do tập con đó gây ra, là đáng tin cậy. Chúng đến từ hồi quy hoặc thử nghiệm ở trên, không phải từ mô hình bị nhiễu.

Với chỉ hai tài xế, Shapley thực sự khá trực quan. Mỗi tài xế giữ lại đóng góp độc lập của họ, sau đó cả hai chia đều phần dư tương tác. Việc hết hạn ưu đãi nhận được 5 điểm phần trăm cộng với một nửa phần dư tương tác 5 điểm phần trăm. Hoàn thành sáng kiến nhận được 4 điểm phần trăm cộng với nửa còn lại.

Phân bổ giá trị Shapley cho các yếu tố gây rời bỏPhân bổ giá trị Shapley cho các yếu tố gây rời bỏ

Đọc kết quả: Việc chia tỷ lệ 7.5 so với 6.5 không phải là tín hiệu để đổ 54% ngân sách giữ chân vào giá cả và 46% vào thành công khách hàng. Đó là tín hiệu bạn cần cả hai, và thời điểm của ưu đãi gia hạn quan trọng ngang bằng với nội dung của ưu đãi đó.

Chuyển đổi hiệu ứng thành doanh thu và LTV

Nhận được một hệ số rời bỏ không giống với việc có một khuyến nghị về giá cả. Cùng một mức tăng rời bỏ vẫn có thể mang lại lợi nhuận ròng nếu mức tăng giá đủ lớn. Bạn phải tính truyền về phía trước (propagate forward) rồi mới biết liệu sự thay đổi thực sự hiệu quả hay không.

Ví dụ, tăng giá 13% trả lời cho riêng nó trong quý đó nhưng lại bào mòn giá trị khách hàng trung hạn. Để hòa vốn trên LTV 2 năm với cùng tỷ lệ rời bỏ đó, bạn sẽ phải tính phí khoảng 1.324 USD, mức tăng 32% thay vì 13% đã áp dụng. Đó không phải là khoảng cách bạn có thể lấp đầy bằng một điểm giá khác. Vấn đề về trường hợp sử dụng cơ bản phải được giải quyết trước.

Một số cạm bẫy cần lưu ý

  • Gán nhiệm vụ có tương quan: Quy trình bán hàng "land-and-expand" tạo ra sự tương quan tự nhiên giữa việc hết hạn ưu đãi và hoàn thành sáng kiến. Bạn bán cho khách hàng một dự án lớn và tặng họ ưu đãi năm đầu để họ bắt đầu. Bây giờ cả hai thứ đều hết hạn cùng một lúc theo thiết kế. Biến đổi ngang (cross-sectional variation) một mình không thể gỡ rối chúng. Bạn cần biến đổi về thời gian, nhóm so sánh, hoặc ngưỡng đủ điều kiện.
  • Sự mong đợi (Anticipation): Kỳ trước chỉ giữ sạch sẽ nếu khách hàng không phản ứng với báo giá gia hạn trước ngày thay đổi giá chính thức. Khi họ làm như vậy, giả định xu hướng song song bị phá vỡ trước khi xử lý được tác động, và hệ số DiD sẽ bắt đầu phản ứng sớm thay vì cú sốc giá thực sự.
  • Sai lệch ước lượng (Estimand drift): Sai lầm phổ biến nhất là mang con số sai đến cuộc họp. Hiệu ứng trung bình của nhóm ưu đãi, hệ số tương tác và phân bổ Shapley là ba câu trả lời khác nhau cho ba câu hỏi khác nhau. Hãy biết bạn đang trình bày cái nào và tại sao.

Sự phân tích (decomposition) mới là sản phẩm giao hàng. Ước lượng nhân quả chỉ là đầu vào.

Chia sẻ:FacebookX
Nội dung tổng hợp bằng AI, mang tính tham khảo. Xem bài gốc ↗