본문 바로가기
Growth

[NDC] 실전 이탈 예측과 유의사항

by Diligejy 2022. 5. 21.

https://www.youtube.com/watch?v=kcE_1n41xdk&feature=emb_title&ab_channel=NDC 

1. 이탈 예측이란?

a. 이탈 예측의 구하고자 하는 3가지 변수

    i. 개별 생존확률(이탈확률)

    Ii. 생존 기간

    Iii. 유저군의 잔존율

 

b. 이탈예측의 목적

    i. 고객의 이탈을 방지

    ii. 고객 생애 가치(LTV), 투자 대비 수익(ROI) 등을 정확히 계산

    iii. 데이터 기반 의사결정

 

c. 이탈예측의 중요성

    i. 신규 유저 유입 대비 기존 유저 유지 비용이 적음

    ii. 모바일 시대에는 유저 생존 기간이 짧고, 이탈 방지를 위한 직접적인 방안(푸시메시지, 출석 보상 등)이 존재

 

 

2. 예측 모델링 프로세스 & 실전 고려사항

a. 예측 모델링 프로세스

    i. 학습 데이터 생성

    Ii. 데이터 가공

    iii. 모델 생성

    iv. 성능 평가

 

b. 실전에서 경험한 문제점

    i. 학습 데이터(학습 대상 + 각 대상에 대한 정보 + 레이블) 생성

        - 이탈의 정의

        - 이탈 예측 대상 선정

    

c. 실전고려사항

    i. 학습 데이터 생성 - 대상은 누구인가

        - 전체 유저에 대해 이탈예측을 하자니... 유저마다 성향이 너무 다름

        - 전체로 하면 정확도가 떨어질 수 있기 때문에 특정 유저에 대해 이탈 예측을 하는 것이 좋음 (비효율적이기도 함)

        - NC는 클러스터링으로 분류된 진성유저를 대상으로 예측

        - 이탈 정책/목표에 맞는 유저군

    ii. 이탈의 정의

        - 이탈이란?

            1) 탈퇴라고 생각하기 쉬우나 1년 이상 미접속 유저 중 서비스 탈퇴 유저는 0.8%

            2) 연속 미접속 기간을 기준으로 삼음

            3) 미접속 기간 기준이 너무 짧으면 비이탈자 오탐을 하고 너무 길면 이탈자를 방치

            4) 적절한 기준을 잡기 위해선 내부 요인 + 미접속 기간에 따른 복귀 / 이탈율 고려해야 함

            5) 충분한 기간동안 Windowing 추천 (시점에 따라 이탈/복귀율이 크게 차이남)

    iii. 

 

 

 

 

 

댓글