본문 바로가기
Growth

빅데이터를 활용한 예측마케팅 전략

by Diligejy 2022. 3. 24.

p.18

완전하고 정확한 고객 프로파일을 구축하는 것은 결코 쉽지 않지만 커다란 가치가 있는 일이다. 만약 당신 회사의 고객 프로파일이 다른 대부분 회사들과 비슷한 상황이라면 고객 데이터는 오류 및 중복으로 가득 차 있을 것이며 마케팅 실무자들은 그것을 제대로 활용할 수 없을 것이다.

 

다행히도 퍼지 매칭을 포함한 예측 기술은 혼란스러운 데이터를 정리하고 온라인 데이터와 오프라인 데이터를 결합하며 디지털 및 물리적으로 나뉜 데이터베이스들을 통합하여 고객 신원을 파악하는 데 도움을 줄 수 있다. 모든 고객 데이터를 한 곳에 모으는 것은 막대한 가치를 지니고 있으며, 기업 각 부문의 고객 접촉 담당자들이 고객 프로파일에 엑세스할 수 있게 하는 것은 각 고객에게 더 나은 경험을 제공하기 위한 중요한 첫걸음이다.

 

p.23

금전적 가치의 유지에 초점을 두는 것이 좋다. 그러지 않으면 고객은 유지하되 돈을 잃을 수 있다. 또 고객 유지율을 측정할 때 모든 고객 이탈이 다 동등한 가치를 지니는 것이 아님을 인식하는 것이 중요하다. 수익성이 낮은 고객을 잃는 것은 최우수 고객을 잃는 것만큼 나쁜 일은 아니다. 그리고 고객이 이미 쇼핑을 그만 둔 후에 그를 다시 활성화하는 것보다 고객이 이탈하지 않도록 예방하고 노력하는 것이 훨씬 쉽고 저렴하며 효과적이다. 

 

p.29

내가 쿠퍼 박사로부터 배웠던 것들 중 중요한 것이 무엇인지 묻는다면 나는 문제를 분해하여 핵심을 파악하고 근본적인 수준에서 문제를 해결하는 것이라고 말할 수 있다. 그는 항상 어떤 문제에 대한 해결책의 이면에 있는 아이디어는 명확하고 아주 간단해야 한다고 말했다. 이것이 마케터들이 보딪치는 문제에 대해서 내가 생각한 방법이다. 오래된 동네 가게에서의 마케팅은 쉬운 일이었다. 그들은 우리 이름과 우리가 좋아하는 것과 싫어하는 것을 알고 있으며 우리를 일대일로 대했다. 획일적one-size-fits-all인 대량 최적화mass optimization시대를 맞이하면서 마케터들은 고객과 멀어지게 되었다. 고객은 그저 설문조사 응답자로 되었고 포커스그룹 인터뷰 참가자일 뿐이었다. 모든 논의는 제품과 채널에 관한 것이었다. 그럼에도 불구하고 고객 중심 마케팅에 대한 필요성은 항상 존재해왔다. 다만 그것은 실천하기에는 실용적이지 않고 비용 대비 효과가 적었을 따름이었다. 정보를 저장, 처리, 추출하는 기술과 결합된 웹, 이메일, 모바일, 소셜, 위치 기반 기술을 포함한 디지털 변환은 무엇이 실용적이고 비용 대비 효과가 큰 것인지에 대해서 심대한 변화를 가져왔다.

 

p.42

사실 고객 니즈를 예측하는 것은 별로 새로운 개념이 아니다. 진짜 새로운 것은 한 번에 수백, 수천 또는 수백만 고객을 대상으로 거의 자동으로 실시간에 이들 고객 각각의 니즈를 대규모로 예측하고 대응할 수 있는 능력이다.

 

p.50

예측마케팅 10가지 예

10가지 질문 예측은 어떻게 도움이 되는가?
1. 최우수 고객은 누구인가? 계정별 매출을 고려하여 가장 높은 평생가치를 지닌 예상고객이나 현재고객을 예측하고 이 고객 계정을 획득하고 서비스하는 데 드는 비용도 예측한다. 이 정보를 사용하여 예상고객에게 일찍부터 시간과 돈을 투자한다.
2. 기존의 최우수고객과 유사한 신규 고객은 누구인가? (B2C의 경우) 유사 타깃팅 또는 (B2B의 경우) 특화된 예상고객 목록 제공업체를 활용해 높은 가치를 지닌 기존 고객들과 가장 유사한 예상고객이 누구인지 예측한다.
3. 데이터에서 페르소나를 찾아내어 그것과 유사한 고객을 더 많이 획득한다 자신의 고객기반에서 브랜드, 제품, 콘텐츠, 행위 등이 가장 잘 구별되는 고객 페르소나 특성을 가진 고객 군집들을 예측한다. 그런 다음 이러한 구매자들을 더 많이 끌어들일 수 있는 창의적인 콘텐츠, 제품 및 서비스를 개발한다.
4. 어떤 마케팅 채널이 가장 수익성이 높은가? 어떤 채널이 미래의 모든 구매를 포함하여 가장 높은 평생가치를 가진 고객들을 유치하는지 예측한다. 이러한 정보를 키워드 입찰 전략 및 채널 투자에 반영한다.
5. 어떤 예상고객(비구매자)이 구매할 가능성이 가장 높은가? (B2C의 경우) 적절한 인센티브를 제공하기 위해 또는 (B2B의 경우) 올바른 예상 고객에게 영업사원의 시간 투자 우선순위를 정하기 위해 누가 구매할 가능성이 가장 높은지 판단한다.
6. 어떤 기존(또는 과거)고객이 구매할 가능성이 높은가? 일회성 구매자가 반복 고객이 되도록 설득하려면 제품에 대한 인센티브(또는 할인)가 필요하다. 또 상향판매 가능성이 높은 후보자에게 집중할 수 있도록 계정 담당자의 시간투자에 우선순위를 설정한다.
7. 기존고객 중 구매할 가능성이 가장 낮은 것은 누구인가? 어느 고객이 이탈할 가능성이 있는지 예측하여 그가 이탈하기 전에 선제적으로 "다시 방문해 주십시오"와 같은 인센티브나 맞춤형 추천을 보내고, 고객 지원담당자가 전화를 걸도록 한다.
8. 어떤 고객이 특정한 신제품에 대해서 관심이 있을까? 어떤 고객이 재고처분 상품 또는 신상품 출시에 관심이 있는지 예측하여 이러한 기업 또는 소비자에게 영업 및 마케팅 노력을 집중하도록 한다.
9. 이 고객이 관심을 가질만한 다른 제품이나 콘텐츠는 무엇일까? 특정 고객을 대상으로 획득 캠페인, 상향판매 캠페인, 리인게이지먼트 캠페인을 수행하기 위해 이 고객에게 어떤 제품 또는 콘텐츠를 추천할 것인지 예측한다.
10. 특정 고객에게 우리 회사의 지갑 점유율은 얼마나 되는가? 높은 잠재가치를 지닌 시장 또는 고객그룹을 예측하여 향후 고객획득 전략의 초점으로 삼는다.

p.54~55

많은 마케터들은 고객과 관련이 있는 경험을 제공한다고 스스로 생각하지만 소비자들의 인식은 종종 매우 다르다. 2013년 애질원이 2,000명의 마케터와 소비자를 대상으로 한 설문조사 결과에 따르면, 마케터의 75%는 고객과 관련성이 있는 마케팅 캠페인을 매년 15회 정도 소비자에게 전달하고 있다고 생각한다. 그러나 소비자 중 34%는 지난 한 해 동안 자신과 관련성 있는 마케팅 캠페인을 단 한 번도 기억하지 못한다고 답했다. 분명히 마케터와 소비자 간의 괴리가 있는 것이다. 동일한 조사에 따르면 마케터의 52%는 고객들의 신호와 상관없이 모든 고객에게 똑같은 내용의 이메일을 보냈고 마케터의 65%는 모든 고객에게 똑같은 횟수의 이메일을 보냈다.

 

마케터들은 사고방식을 극적으로 바꾸어야 한다. 오늘날 이메일 캠페인에서 클릭율이 4%가 되면 마케터는 기뻐서 환호할 것이다. 하지만 사실 이것은 고객의 96%가 그 이메일이 자신과관련성이 없다고 판단했다는 것을 의미한다. 그것은 형편없는 결과이다. 우리는 모든 고객이 자신과 관련성이 없는 정중한 커뮤니케이션 메시지를 받을 자격이 있다고 생각한다. 이제 마케터들은 1%의 관련성을 지닌 100개의 메시지를 보내는 것보다 100% 관련성을 가진 1개의 메시지를 보내야 한다.

 

p.72~74

이탈한 웹사이트 방문자를 대상으로 한 캠페인처럼 간단한 전략도 쉽게 결정할 수 있다. 당신의 웹사이트를 방문했지만 구매자로 전환되지 않은 예상고객은 당신이 놓친 중요한 기회이기 때문에 웹을 통해 이러한 비구매자들을 추적할 수 있는 많은 리타깃팅 솔루션들을 이용할 수 있다. 만약 구매 가능성에 따라 고객에게 제공하는 혜택을 차별화할 수 있다면 어떨까? 구매 가능성이 매우 높은 사람들에게는 간단한 리마인드 메시지만으로도 지갑을 열도록 하기에 충분하겠지만, 구매 가능성이 매우 낮은 사람들에게는 할인 또는 무료 배송을 제안해야 한다.

 

위 그림은 다이렉트 메인 캠페인에 대한 고객응답 예측을 보여준다. 이 모델은 본질적으로 고객의 최상위 10% 즉 첫 번째 십분위가 다이렉트 메일에 대한 전체 응답자들 중 52%를 차지할 것으로 예측한다. 이를 근거로 카탈로그를 최상위 십분위에게만 발송하도록 결정할 수 있다. 특정한 수의 응답율(예:70%)을 목표로 하는 경우 최상위 2개 십분위에게 발송해야 한다. 그렇지 않고 두 번째 또는 세 번째 십분위에게 발송하는 것을 고려할 수도 있는데 이는 최상위 십분위는 어찌됐든 구매할 가능성이 높지만 두 번째 또는 세 번째 십분위의 경우 구매를 자극하기 위해서는 카탈로그를 보내야만 할 수도 있기 때문이다. 또는 카탈로그가 수량 또는 예산이 제한된 경우 응답할 가능성이 가장 높은 고객들을 대상으로만 카탈로그를 발송할 수도 있다. 이 모델을 사용하는 다른 방법은 각 십분위별로 a/b테스트를 통해서 향상도를 측정하여 카탈로그 발송 대상을 어느 십분위까지 늘렸을 때 수익 증가분 대비 비용 증가분이 정당화되는지 확인하는 것이다.

 

이 유형의 모델은 예상 고객과 기존 고객의 미래 행위를 예측하는 데 사용할 수 있다. 예를 들어, 내가 처음으로 구찌 핸드백을 구입한 순간부터, 이 사치품 업체는 내가 앞으로 핸드백을 몇 개나 더 구매할지에 대해서 높은 정확도로 예측할 수 있다. 나는 구찌에서 다시 구매할 의향이 없을 수도 있지만 이 브랜드 업체는 나에 대해서 더 잘 알고 있다. 구찌의 알고리즘은 나의 구매, 웹사이트 방문, 이메일 클릭이나 나의 연령, 성별, 지역 등을 이전에 구매한 수천 명의 다른 고객의 행동 및 인구사회학적 특징과 비교한다. 아이러니하게도 구찌는 나의 미래 구매행위에 대해서 나보다 더 잘 예측할 수 있다.

 

p.74~76

예측분석이 널리 보급되기 전에는 RFM이라고 불리는 모델이 구매 가능성이 높은 사람을 파악하는 업계 표준 방식이었다. 그러나, 그것은 효용이 제한적이며 현실 생활에 적용하기가 생각보다 너무 어렵다. 또한 RFM이 종종 예측 모델로 분류되더라도 그것은 단지 통계적 또는 예측적 깁나이 없는 (주먹구구식으로 나름 지적인 추측을 하는) 단순한 경험적 접근방식일 뿐이다.

 

이 모델의 핵심 아이디어는 한 고객이 당신의 제품을 최근에 구입했거나, 자주 구입했거나, 당신의 제품에 많은 돈을 지출했다면 그 고객은 당신의 제품을 다시 구매할 가능성이 높다는 것이다. "그 고객이 우리 제품을 마지막으로 구입한 이래로 며칠이 지났는가?"(시기), "그 고객은 우리 제품을 얼마나 자주 구매했는가?"(빈도), "그 고객은 우리에게 얼마나 많은 매출을 가져다 주었는가?"(금액)라는 질문은 그 고객이 다시 구매하기 위해 돌아올 것인지를 예측할 수 있게 해주는 훌륭한 변수인 것은 분명하다.

 

그러나 이 기법에는 한계가 있다. 그 중 하나는 기업이 자체 데이터를 사용하는 방식을 심각하게 제한한다는 점이다. 데이터에서 파생될 수 있는 많은 다른 변수들 중에서 추가적으로 우수한 예측 변수로 사용할 수 있는 것들이 있다. 또한 "과거의 결과가 미래의 성과를 보장하지 못한다"라는 옛 격언은 RFM 모델링에도 적용된다. RFM은 한 고객의 현재 행동을 과거 다른 사람들의 이후 행동과 비교하기보다는 오로지 해당 고객의 과거에 대해서만 되돌아본다. RFM을 사용하면 높은 가치의 고객이 실제로 구매를 하기 전에는 이들을 인지할 수 없다. 과거 높은 가치의 고객이 이미 경쟁업체로 넘어갔다는 것을 알아차리지 못할 수도 있다.

 

예를 들어보자. 고객들이 몇 차례 구입한 뒤 사라지는 패턴이 있을 수 있다. 이를 파악하는 유일한 방법은 고객행동을 그와 유사한 다른 고객과 비교하여 미래 행동에 대한 예측을 하는 것이다. 만약 대부분의 고객이 3번 구매한 다음 사라진다면, 이미 3번 구매한 어떤 고객이 다시 구매할 가능성은 사실 매우 낮지만 RFM 모델은 이 고객을 "구매 가능성 매우 높음"이라는 세그먼트에 배치할 것이다. 따라서 반응을 할 가능성이 높은 좋은 고객이 가치가 그다지 높지 않은 세그먼트에 포함되어 프로모션 발송대상에서 제외될 수 있고, 반대로 가치있는 세그먼트에 그다지 좋지 않은 고객이 포함될 가능성이 있다. 고객이 속한 세그먼트의 가치가 아니라 고객의 가치를 기준으로 고객의 순위를 매기는 응답 모델은 이러한 문제를 해결할 수 있다. 

 

RFM 모델은 유통업과 같이 구매가 빈번한 환경에서만 향후 구매할 가능성에 대한 예측을 할 수 있다. RFM 모델은 고객평생가치, 멤버십 및 이메일 수신과 같은 서비스의 해지 가능성, 또는 웹 사이트 방문자(비구매자)가 최초 구매자로 전환할 가능성을 예측하는 데는 아무런 역할을 하지 않는다. 감독학습 모델은 이렇나 모든 고객 행위를 예측하는 데 사용할 수 있다. 상위 50%의 고객을 선택하는 RFM 모델과 경향성 모델을 비교한 테스트들이 여러 차례 있었는데 경향성 모델은 RFM 모델보다 평균 40% 더 정확했다. 이는 대부분의 경우에 프로모션 비용이 20~25% 절감된다는 것을 의미한다.

 

역설적이게도 경향성 모델은 더 정확할 뿐만 아니라 현업 마케터들이 사용하기에도 훨씬 더 쉽다. 캠페인에 사용할 시기, 빈도, 금액의 수백 가지 가능한 조합 중에서 어떤 것을 선택할지 고민하는 대신 10개의 경향성 십분위 중 어느 것을 포함할지 결정하면 된다. 예측분석을 통해 마케터는 고객을 구매가능성이 가장 높은 사람에서 가장 낮은 사람까지 자동으로 순위를 매긴 목록을 받아볼 수 있다.

 

p.82

만약 회사 자체적으로 예측분석 역량을 구축하려는 경우 데이터의 수집, 통합, 클렌징, 정비를 누가 수행할지에 관한 문제를 명확히 언급해야 한다. 일반적인 데이터과학자는 이러한 작업을 수행하기 싫어하며 이 작업을 수행하기 위해 별도의 소프트웨어를 사용하거나 또는 데이터 통합 엔지니어를 고용해야 할 가능성이 높다.

 

p.86~87

예측분석의 경우 알고리즘을 작성하는 것만으로는 충분하지 않다. 알고리즘을 사용하기 전에 알고리즘이 실제로 제대로 작동하는지 백테스트를 개발해야 한다. 예측마케팅 소프트웨어 패키지를 사용하는 경우 공급업체가 이미 이를 수행했을 것이다. 그러나 당신 회사의 예측분석 모델을 자체 개발하는 경우 모델을 사용하기 전에 모델을 훈련시키고 테스트하고 검증해야 할 필요가 있다. 예측 알고리즘을 개발하는 데 필요한 시간은 80% 훈련, 10% 테스트 및 10%의 유효성 검사로 나눌 수 있다. 이는 즉 알고리즘을 작성한 후 데이터 과학자는 상당한 시간을 들여서 알고리즘을 훈련시키고 테스트하여 정확하게 작동하는지 확인해야 한다는 것을 의미한다. 

 

예를 들어 구매 가능성 모델을 개발한다고 가정해보자. 만약 1천만 명의 고객 중 1%가 향후 30일 이내에 구매할 것으로 예상한다면, 우리는 구매 가능성 모델을 훈련시키기 위하여 지난 달에 구입한 고객 100,000명의 데이터를 사용하고 또한 지난 달에 아무 것도 구매하지 않은 100,000명의 고객을 무작위로 선택한다. 따라서 데이터 세트 전체에는 200,000만 명의 고객이 포함되는 데 그중 50%는 구매한 고객이고 나머지 50%는 구매하지 않은 고객이다. 이러한 오버 샘플링은 모델이 잠재 구매자와 비 구매자의 차이를 감지하는 데 집중하도록 해주기 때문에 더 나은 결과를 산출한다.

댓글