부끄러운 얘기지만, 분석가로서 처음 입사했을 때 '그래서 결론이 뭐에요?'라는 말이나 '너무 두루뭉술해요' 등의 말을 듣곤 했다. SQL쿼리를 잘 짜는 것도 분석가에게 중요하지만, 어떤 문장이 들어왔을 때 해당 문장을 논리적으로 분해하고 분석 방향을 잡아가는 것도 중요하기 때문이다.
그래서 그 당시에 스트레스를 많이 받아가며 나름대로 어떻게 이런 문제를 어떻게 해결할지 고민했었는데, 내가 주로 사용했던 방법은 컨설턴트들이 쓴 책을 계속해서 읽기였다. 단순히 로직트리, MECE와 같은 기법들을 익히는 게 목표가 아니었다. 어떻게 해야 논리적으로 분석할 수 있는지 연습할 곳이 필요했고 그런 책들을 읽으며 도움을 받곤 했다.
물론 개인적인 공부보다도 실무에서 굴러가며 훈련한게 훨씬 더 빠르게 도움이 되었다. 특히 논리적으로 사고하는 걸 잘하는 동료들을 보며 그들이 어떻게 분해하고 질문해서 구체화시키는지 관찰하며 흡수하기 위해 노력했다.
이 책을 읽으며 지금도 코흘리개이지만, 더더욱 코흘리개였던 그 때가 떠올랐다. 이 책에서는 여러 가상의 질문을 바탕으로 질문을 쪼개고 분석을 진행하는 연습을 하는데, 완전 코흘리개였던 때의 내가 했던 거였고, 지금도 실무에서 데이터분석가로서 내가 하고 있는 일이다.
데이터 분석가로서 같이 협업하는 분들에게 부탁을 하곤 한다. 요구사항이 명확하지 않으면 명확해질 때까지 물어볼 수밖에 없다고. 정말 질릴때까지 물어본 적도 있다. 왜냐하면 요구사항이 불명확한 상태여서 내 생각대로 우선 작업 해놓았는데, 나중에 갑자기 고객사에서 그게 원하는 요구사항이 아니었다고 피드백이 오는 경우도 있기 때문이다.
그래서 계속해서 물어본다. 고객이라고 했을 때 그 고객의 정의가 무엇인지, 구매라고 했을 땐 구매의 정의가 무엇인지. 현실적인 조건 상 분석가가 알아서 진행하는 경우도 간혹 있지만, 대부분은 귀찮을 정도로 묻고 또 물어서 진행한다. 그리고 분석가는 그렇게 질문을 한 댓가로 월급을 받는다. 어쩌면 얼마나 논리적으로 질문하고 그 질문을 분해해서 분석 방향을 잡는지가 자신의 가치를 증명하는 것일지도 모르겠다.
마케터나 분석가로서 이미 훈련을 많이 받으신 분이라면 이미 다 아는 내용일거라고 생각한다. 그래서 이 책은 신입/주니어에게 적합할 듯 하다. 특히나 문장쪼개기는 매우매우 중요한 훈련이므로 꼭 해보길 추천하고 싶다. 책을 읽으며 멘탈 모델 훈련을 충분히 하다보면 실무에서 달라지는 게 느껴질지도 모르니까.
이 책의 아쉬움은 주로 오프라인쪽에 집중된 분석이라 웹 로그 분석 사례같은 경우는 별로 없다는 점인데, 다음엔 로깅설계나 로그 분석 관련해서 책을 내주었으면 좋겠다.
밑줄긋기
p.10~12
회사에서도 실험 설계를 할 필요가 있다. 회사에서 논문을 쓰라는 얘기가 아니다. 회사에서 어떤 의사결정을 하거나 소비자를 이해하거나 실적을 바라볼 때, 다각도로 살펴볼 전체 그림을 그려보아야 한다는 것이다. 이 전체 그림에서 데이터의 역할은 절대적이다. 다양한 종류의 데이터가 여러 현상을 설명해줄 것이고, 이 낱개의 현상들을 하나의 문장으로 단정하기 전에 또 다른 측면은 없는지 살펴보아야 한다.
기업이 이해해야 하는 소비자는 코끼리와 같다. 소비자의 어떤 한 면만 보고 단정해서는 안 된다. 작년의 소비자가 올해의 소비자와 다를 수도 있다. 소비자의 전체 모습을 이해하려면 매우 다양한 조건과 측면을 살펴보아야 한다.
데이터는 소비자가 남긴 흔적을 말해준다. 소비자가 어떤 환경에서 구매를 하는지(하지 않는지), 제품의 어떤 부분이 바뀌었을 때 더 많은 판매가 일어나는지(일어나지 않는지), 매장이나 위치나 소비자 특성 등 모든 것이 다 데이터이자 판단을 내리기 위한 조건이다.
그런데 하나의 지표, 즉 데이터의 한 단면만 보면 잘못된 판단을 내리기 쉽다. 오히려 데이터를 보지 않느니만 못한 상황이 일어나기도 한다. 경험과 오감을 사용해 내린 결론보다, 하나의 지표만 보고 내린 결정이 더 잘못될 수 있다.
잘못된 의사결정을 피하려면 데이터를 디자인해야 한다. 자신이 궁금한 것, 프로젝트 방향, 의사결정해야 할 사안들을 확인하기 위해 데이터를 보는 방법에 대한 계획을 세워보는 것이다.
p.25-28
문장을 쪼갠다는 것은, 머릿속에 떠오른 질문을 데이터 단위로 분해하는 것이다. 이는 분석을 시작할 때 매우 유용하며, 데이터를 잘 모르는 사람도 연습할 수 있다. 이 연습을 통해 데이터 분석뿐 아니라 실험 연구 등의 단초가 되는 사고방식을 훈련할 수 있다.
지금부터 질문 쪼개기 예시를 다양하게 보여주고자 한다. 이 질문 쪼개기만 잘해도, 앞으로 데이터 분석, 보고서 작성, 논문 작성시 추진력을 얻게 될 것이다.
휴가를 준비하던 당신이 선글라스를 하나 샀다. 친구가 그 선글라스를 보고 어디서 샀느냐고 물어봤다. 당신은 이렇게 대답했다.
"요즘 잘 나가는 ~~마켓이 있어. 거기서 다른 데보다 저렴하게 팔더라고."
이 문장을 구성하는 단어들을 데이터 단위로 쪼갤 수 있다.
- 요즘 : 요즘이란 언제부터 언제까지인가? 몇 년, 몇 달, 혹은 몇 주나 며칠로 표현할 수 있는가?
- 잘 나가는 : 잘 나간다는 것은 무슨 의미인가? 매출 규모가 크다는 것인가? 매출 순위나 성장률이 높다는 것인가? 어느 집단 내에서 잘 나간다는 것인가? 한국인가, 서울인가? 혹은 특정 연령층이 많이 사용하는 웹/앱인가?
- 다른 데보다 : ~~마켓의 경쟁업체는 어디인가? ~~마켓과 유사한 매장은 무엇인가? 선글라스를 파는 모든 매장인가, 특정 브랜드를 파는 곳인가, 아니면 멀티숍인가?
- 저렴하게 : 얼마나 싸다는 것인가? 평균 가격 대비 싼 것인가? 전 세계 비교 가격 중에 가장 싼가? 온/오프라인 최저가인가? 정품 취급 업체 중에서 저렴하다는 것인가? 모든 선글라스를 저렴하게 파는가? 다른 제품은 다 비슷한데 이 제품만 저렴한가? 특정 기간에만 저렴하게 파는가?
p.55-56
데이터 분석은 큰 관점부터, 작게 시작해야 한다. 우선 큰 관점부터 만들어보자. 데이터 중 가장 구하기 쉽고 전체를 조망할 수 있는 숫자를 펼쳐보기를 권한다. 대표적으로, 일별 매출이나 월별 매출, 연간 매출 등의 숫자를 시간 순서에 따라 라인 차트 등으로 만들어보자. 기업에서 문제의식의 시작은 '매출이 떨어졌다'거나 '원하는 매출이 나오지 않았다'는 것이다. 매출이 어느 시점부터 기대보다 떨어졌는지 확인해야 한다. 그 시점을 확인하면 그 시점이나 이전에 일어난 다른 일들 혹은 연계 분석할 수 있는 실마리를 얻게 된다.
작게 시작하자는 것은, 일단 아주 간단한 라인 차트부터 만들어보자는 말이다. 데이터 초심자가 시작해야 할 것은 모델을 활용한 매출 예측이 아니다. 일단 과거 매출의 모양부터 확인하는 것이다. 만약 누군가 작성한 방법에 따라 매출 예측 모델을 만들어본다 해도, 그 진정한 의미를 이해하고 다음에도 활용할 수 있어야 한다. 받아쓰기 하듯이 따라 분석한 것은 일회성으로 끝날 확률이 높다.
책이나 강의 동영상을 보고 데이터 분석을 공부한 사람이 실제 회사에서 활용하지 못하는 이유가 이 때문이다. 샘플 데이터를 보고 따라하면 당연히 결과가 똑같이 나오고, 분석을 할 수 있게 되었다는 생각이 든다. 그런데 회사에서 마주하는 프로젝트나 데이터는 전혀 다르다. 응용하지 못하면 데이터 분석을 할 수 있다고 말하기 어렵다.
성장 가능한 데이터 분석을 하려면, 일단 아주 간단한 것부터 직접 그려보는 것에서 시작해야 한다. 남의 손을 빌리지 않고 단 한 번이라도, 엑셀로라도 월별, 일별, 시간별 매출을 집계하고 라인 차트를 그려보자. 누적값으로도 그려보고, 증감으로도 그려보자. 테이블 하나로도 다양한 차트와 관점으로 분석이 가능하다는 것을 직접 경험해보아야 한다. 거기서부터 시작해야 더 나아간 분석을 할 수 있다.
p.71-72
자신이 하는 의사결정이 어떤 의미인지 제대로 알고 확신하는 것이 중요하다. 자신이 데이터를 기반으로 이해를 하고, 자기 의사결정에 확신을 갖기 위해 데이터를 본다고 해도 과언이 아니다.
머신러닝을 통해 자신이 모르는 의사결정조차도 기계가 대신 해줄 것이라고 기대하는 사람이 있다. 물론 그런 영역이 있다. 데이터는 사람보다 더 좋은 광고 배치, 더 나은 제품 제안 등을 해줄 수 있다. 그런데 '어느 순간 기계가 이런 의사결정을 하도록 하자'는 의사결정은 인간이 해야만 한다. 이때 기계가 해주던 것이 어떤 의미인지도 모른 채 의사결정을 할 수는 없다.
그래서 기계가 대신 하든, 외부 컨설팅을 맡기든, 이 블랙박스의 전체 그림은 알 필요가 있다. 어떤 데이터가 들어가고 어떤 데이터가 나오는지는 이해해야 한다. 블랙박스 안의 내용을 몰라도 되는 세상은 오겠지만, 앞과 뒤의 의사결정은 여전히 인간의 몫이다. 따라서 데이터를 이해하고 사고할 줄 아는 역량은 더욱 중요해진다.
같은 팀의 엔지니어가 이런 말을 했다. "언젠가는 기술이나 도메인 지식을 가진 양극단의 인력만 남을 것 같다"고. 그런 예측에 동의한다. 데이터 업계에서는 궁극의 기술력을 지닌 사람이나 인문학적인 사고와 현장 경험인 도메인 지식을 가진 사람만이 남는 세상이 올 것이다. 통계나 모델링에서 자동화될 부분이 많아지면서, 결국 데이터를 자동화할 기술과 자동화된 데이터로 좋은 의사결정을 하는 사람만 남게 될 것이라는 말이다.
그렇다면 이제 중요한 것은 데이터로 어떤 의사결정을 하느냐다. 데이터를 보고 방향성을 어디로 잡고, 어떤 변화를 제언하는 지가 데이터 분석의 최종적인 결과물이 될 것이다. 이 변화를 위한 핵심적인 인력이 데이터 분석 역량을 가진 사람이라고 볼 수 있다.
p.74-75
이렇게 데이터의 세부 내용에 따라 의사결정의 방향성이 달라진다. '캠펭족이 늘고 있으니 캠핑용품을 만들어야 한다'는 덜 구체적이다. '캠핑 의자를 ~~브랜드와 콜라보레이션하여 ~~사이즈로 만들어야 한다'는 지나치게 구체적이다. '캠퍼 성장 중에서도 ~~연령층 혹은 ~~특징을 가진 캠퍼가 늘고 있으므로, 그 소비자군이 선호하는 ~~브랜드나 ~~브랜드와 같이 편의성을 중시하는 브랜드와 콜라보레이션하자'는 제언의 방향성을 잡아내는 것이다. 이 문장도 너무 두루뭉술하거나 너무 지엽적이라고 보는 사람도 있다. 이러한 제언은 조직이나 개인의 성향에 따라 수위가 정해질 수 있으니, 여러 번 시도하면서 수위를 파악하는 것이 좋다.
1) 사람들이 좋아할 만한 제품을 만들기 위해 다각적으로 살펴보아야 한다. (X)
2) ~~을 좋아하는 고객군은 ~~맛과 ~~색을 선호한다. 해당 고객군이 많이 활동하는 곳으로는 ~~마트가 있다. (O)
3) ~~맛의 음료를 만들어 ~~색 포장지로 만들고, ~~마트에서 판매해야 한다.
상황에 따라 다르지만 데이터 전문 조직에서 제언을 할 때, 지나치게 일반적인 내용을 제시하면 실행할 만한 인사이트가 없고, 지나치게 구체적인 방향성을 제시하면 현장 전문가들의 의견을 배제하는 것처럼 보인다. 그 중간쯤, 현장에서 활용할 수 있으면서도 구체적인 제언을 해야 한다.
p.98
데이터가 개인의 성과를 측정하고 책임을 묻는 데 사용된다는 조직 분위기를 없애야 한다. 데이터 자체에 대한 거부감과 두려움이 생기기 때문이다. 데이터에 대한 거부감을 들여다보면, 의사결정자가 질책하는 것에 대해 두려움을 느끼는 경우가 많다. 이 두려움 탓에 데이터 활용이나 데이터 조직의 활동 자체를 거부하거나 비협조적인 자세가 나오기도 한다. 이를 바꾸기 위해서는 다시 한 번, 의사결정자들의 과감한 결단과 의지가 필요하다. 단순하게 직원의 실적과 순위 매기기 수단으로만 데이터를 사용한다면, 그 조직에서는 앞으로도 데이터가 잘 활용되기 어려울 것이다.
따라서 기업이 더 나은 방향으로 나아가기 위한 성장 동력으로 데이터를 가감 없이 활용하는 것을 명시하면서, 평가 수단으로 사용하지 않으려고 노력해야 한다. 데이터가 사람을 위해 일하는 것이지, 데이터가 사람을 평가하고 괴롭히는 존재라고 인식되어서는 안 된다.
p.106
좋은 모델을 만드는 것은 초심자에게 어려운 일이다. 따라서, 매출 증감에 대해 자신이 손꼽아볼 수 있는 원인을 구분해 정리하는 것을 권한다. 미래를 예측하겠다는 어려운 관점이 아니라, 지금까지의 매출 요인을 나누어본다는 식으로 접근하는 편이 낫다.
p.107~108
1. 데이터 디자인 - 질문하기
매장 매출이 감소했는데 내가 잘못해서 그런걸까? 다른 원인은 없는가? 불경기라고는 하지만, 내가 더 해볼 수 있는 건 없을까?
2. 데이터 디자인 - 문장 쪼개기
- 매장 매출이 감소했는데 : 언제보다 감소했는가? 어제? 지난주? 지난달? 작년? 같은 기간? 같은 요일 간 비교하고 있는가?
- 내가 잘못해서 그런걸까? : 매출 감소에 어떤 요인이 있는가? 모든 요인이 감소 이전과 동일한가? 매장 인테리어, 메뉴, 간판, 식기 등이 같은데도 감소했나? 어떤 광고나 홍보 수단이 추가되거나 없어졌는가? 판매하는 사람이 바뀌었나? 제품 진열이나 제품 구성이 바뀌었나? 서비스나 맛에 변화가 있었나?
- 다른 요인은 없는가? : 매장 매출에 영향을 미치는 외부 요인은 없나? 시장 상황이 정말 바뀌었나? 이 상권에 방문하는 사람이 줄거나 늘었나? 주변에 나와 비슷한 제품을 판매하는 매장이 생겼나? 아니면, 코로나나 메르스같이 개인이 저항할 수 없는 일이 일어났나? 비가 많이 오거나 춥거나 더워지는 등 날씨 변화가 있었나?
- 불경기라고는 하지만 : 외부 영향이라는 근거는 무엇으로부터 얻었는가? 그냥 체감하기에 그런 것인가, 실제로 유사한 업종의 많은 매장이 외부 영향을 받고 있는가?
- 내가 더 해볼 수 있는 건 없을까? : 마냥 경기가 좋아지기를 바랄 수 있을까? 어려운 상황 속에서 해볼 수 있는 일을 다 해보았는가? 지치고 불안한 마음 때문에 조바심을 내는 상황인가? 매출이 감소한 원인으로 꼽은 것 중 개선할 수 있는 것이 하나도 없을까?
p.113
요일별 데이터는 '주중/주말'같은 기준으로 다시 나누어볼 수 있다. 물론 데이터를 확인해 그룹으로 만들기에 타당한 패턴을 발견한 다음이다.
p.116
주중에는 회사로 출퇴근하는 고정 고객이 확보되는데, 왜 주말에는 상권이 활성화되지 않는가? 전년 대비 주말의 유동인구 자체가 줄어들어, 상권 유입 대비 매장을 찾는 고객도 주말에 감소한 것으로 보인다. 주말에 방문하는 고객층의 변화가 매출 감소에 영향을 주는 주요 요인인 것 같다.
그렇다면 이 주말 고객층을 다시 끌어들일 방법은 없을까? 혹은 아직 남아 있는 고객층의 특성을 더욱 자극해 그들이 소비를 더 많이 하도록 제품을 권해주는 방법은 없을까? 아니면, 아예 주말 고객은 포기하고 주중에 방문하는 고정 고객을 위한 매출 증진 방법은 없을까? 다양한 각도로 살펴보다가, 점차 가닥이 잡히는 방향성에 대한 추가 분석을 진행해야 한다.
각각의 분석을 이어 이야기를 만들어내고 방향성을 제시한다. 주중 고객 특성, 주말에 방문하는 고객 특성, 주말에 방문하지 않는 고객 특성으로 세 가지를 잡아본다. 이 각각의 고객들이 많이 구매하는 제품을 목차로 만들고, 이 고객들을 더 만족시킬 수 있는 제품 판매 방법을 찾는 것이 방향성이 된다.
p.121-122
프로젝트가 성공하든 실패하든, 매출을 구성하는 요인을 살펴보고 개선해보는 경험이 중요하다. 주중 판매 증가에 실패했다면, 다음번에는 주말 고객을 대상으로 색조 화장품을 더 팔아볼 계획을 세워보는 것이다. 주말 고객 중 구매력이 많았던 장년층보다 젊은 고객이 더 많아졌다면, 젊은 고객을 대상으로 판매할 색상에 더 집중하거나, 포장 방법을 바꾸거나, 젊은 고객이 더 자주 사용하는 플랫폼으로 홍보 채널을 이동해본다.
p.125-126
1. 데이터 디자인 - 질문하기
왜 시험기간에 샷 추가를 많이 할까? 시험 기간이 되었으니 잠을 깨기 위해서일까? 그냥 카페인이 엄청나게 많이 든 에너지 음료를 팔면 어떨까?
2. 데이터 디자인 - 문장쪼개기
- 왜 시험기간에 : 시험 기간이라서 그런 걸까? 혹시 시험이 아니라, 이달에만 그런 건 아닐까? 샷 추가 커피 판매가 학기별로 중간고사, 기말고사 기간과 맞물리는가?
- 샷 추가를 : 샷 추가란, 기존에 추가하지 않던 사람이 샷을 추가하는 것을 말하는 것일까? 아니면 진한 커피를 마시는 사람들이 늘어난 걸까?
- 많이 할까? : 언제보다 많이 하는가? 동기간을 비교해야 할까? 작년과 비교해야 할까? 아니면 시험 기간과 아닌 기간을 나누어 비교할 수 있을까? 얼마나 늘어나야 많은 것일까?
- 시험 기간이 되었으니 : 시험 기간은 명시적인 기간인가? 며칠부터 몇리까지라고 규정할 수 있는가? 아니면, 특정 기간의 전후 1~2주까지 잡는 것이 필요할까? 기간을 설정할 때 참고할 만한 공지사항이나 사람들의 증언이 있을까?
- 잠을 깨기 위해서일까? : 공부를 더 많이 하기 위해 잠을 깬다는 전제로 생각한 문장일 것인데, 실제로 샷 추가를 하는 이유는 무엇일까? 정말 졸음을 참기 위해 그런 것일까?
- 카페인이 엄청나게 많이 든 : 졸음을 참기 위해 샷 추가를 한다고 전제하면, 카페인 양이 주요한 판매 증가 원인일까? 카페인이 많이 들었다는 것은 어느 정도의 양을 말하는가? 카페인 섭취에 대한 기준치나 권고사항이 있지 않을까?
- 에너지 음료를 팔면 어떨까? : 에너지 음료라고 함은, 커피가 아닌 다른 음료를 말하는가? 샷이 많이 든 커피를 파는 것으로는 충분하지 않는가? 에너지 음료는 공산품을 말하는가? 아니면 카페에서 직접 만들어서 팔 수 있는 새로운 음료 개발이 필요할까?
p.129
기존 고객과 신규 고객의 변화를 살펴보는 일은 의미있다. 매출이 올랐는데 기존 고객이 떠난 상황이라면? 리텐션에 실패한 원인이 있는지, 아니면 구매 고객의 세대 교체가 불가피했는지 알아야 한다.
p.131
p.132
고객에게 물어보았더니 '도서관에 오래 있으면서 마실 거라, 맛이 변하지 않게 하려고' 샷 추가를 한다는 것이다. 물을 담아가면 당장 무겁기도 하고 얼음이 녹으면서 커피가 묽어지니까, 도서관에서 자리를 잡은 다음 물을 채워넣는다는 것이다.
커피를 마시면서 졸음을 깨려고 하는 것도 맞지만, 진한 커피 맛이 변하지 않도록 하는 것이 더 중요한 이유였다. 커피를 타는 사람으로서, 추출한 지 몇 분이 지나면 이미 커피 맛은 변한다고 말해주고 싶지만 소비자에게는 그게 중요한 것은 아닌 것 같다. 소비자에겐 도서관에서 오래 앉아 공부를 하면서도 진한 커피 맛을 느끼고 싶다는 것이 중요했다.
p.139-140
1. 데이터 디자인 - 질문하기
추운 날씨에 잘 팔리는 제품은 무엇일까? 더운 날씨에 잘 팔리는 제품은 무엇ㅇ리까? 비 오는 날이나 눈 오는 날에도 따로 잘 팔리는 제품이 있을까?
2. 데이터 디자인 - 문장 쪼개기
- 추운 날씨에 : 춥다는 것은 섭씨/화씨 몇 도부터인가? 특정 온도를 말하는가? 아니면 전날이나 그전 주보다 추워진 것을 말하는가? 특정 온도로 정할지, 상대적으로 그전 기간보다 기온이 떨어진 것으로 정할지 결정해야 한다.
- 잘 팔리는 제품은 : 평균적인 판매 추이가 있는가? 특정 제품이 평균보다 올라간 수치로 '잘 팔린다'를 정의할 것인가? 아니면 추운 날씨로 정의된 날의 상위 판매 규모 순위를 매길 것인가?
- 무엇일까? : 제품군을 어떻게 정의할 것인가? 내 회사/매장에서 판매하는 제품들의 카테고리가 나누어져 있는가? 어떤 '카테고리'가 잘 팔리는지를 볼 것인가, '제품'이 잘 팔리는지 볼 것인가? 혹은 어떤 제품의 '사이즈'나 '용량' 변화까지 살펴볼 것인가?
- 더운 날씨에 : '덥다'도 '춥다'와 마찬가지로 정의가 필요하다. 특정 계절의 기온으로 볼 것인가, 일교차나 전일 혹은 전주 대비 변화 등으로 정의할 것인가?
- 잘 팔리는 제품은 무엇일까? : 위의 질문과 동일한 정의가 필요
- 비 오는 날이나 : '비가 온다'는 것은 강수량 얼마 이상을 말하는가? 비가 오는지, 안 오는지로 정의하는가? 하루 중 잠깐이라도 비가 오는 날을 말하는가? 비가 오는 특정 시간대를 구분할 것인가?
- 눈 오는 날에도 : 눈이 오는 것도 강수량과 마찬가지다. 얼마만큼 눈이 와야 눈이 온다고 정의할 것인가? 하루 중 잠시라도 눈이 오는 것, 진눈깨비, 쌓이는 정도 등을 어떻게 정의할까? 어떤 시간대에 잠깐 눈이 와도 눈 오는 날로 볼 것인가?
- 잘 팔리는 제품이 있을까? : 위의 질문과 동일한 정의 필요.
p.142
결국 날씨를 분석할 때 가장 중요하게 정의할 데이터 단위는 '시계열'이다. 연월일시분초 단위의 데이터를 어떻게 나눌지 고민해야 한다. 가능하면 다 쪼개어 보고, 의미 있는 단위를 발견하기를 권한다. 사람이란 확인하기 전까지는 '내가 보지 않은 저 곳에 내가 모르는 굉장한 것이 있을지도 몰라'라는 생각을 하기 때문이다.
하나의 의미 있는 단위를 설정하기 전에 모든 단위를 살펴보는 것은 자신감과도 직결된다. "왜 이 단위로는 보지 않았는가?" 라는 상급자 혹은 타 부서의 질문에 자신 있게 답할 수 있기 때문이다. "이미 그 단위도 살펴보았지만, 이런저런 이유로 가장 나은 단위인 이 분석이 채택되었다"고 말할 수 있다.
p.154
설문조사는 목적이 매우 명확해야 한다. 설문조사를 하기 전에 일단 모을 수 있는 모든 데이터를 분석하고, '데이터로는 답을 찾을 수 없고 소비자만이 답을 줄 수 있다'는 것이 명확해진 뒤에 설문조사를 하는 것을 권한다.
자신이 기획한 대로 판매되는 것 같지 않을 때, 사람들에게 'why'를 물어볼 수 있다. 이를테면 어린이를 위한 안전 매트가 운동 기구의 층간소음 방지용으로 사용되거나, 술잔으로 제작된 컵이 카페의 아인슈페너 잔으로 활용되는 것과 같은 사례다.
판매자 입장에서는 자신이 생각하지 못한 반응을 접했을 때, 다시 자기 생각대로 무작정 추정하기보다는 소비자에게 생각을 물어보는 과정이 필요하다.
이 과정에서 또 다른 소비자의 니즈를 발견할 수도 있다. 설문조사는 이 'why'의 탐색에 포커스를 맞추는 것이 좋다.
설문조사 자체가 별도의 분석으로 진행되기보다는, 분석하는 주제를 하나 잡고 그 중에서 소비자에게 직접 물어보아야 하는 경우에 활용하는 것이 좋다. 분석 중 설문조사를 함께 진행하는 케이스를 말해보고자 한다. 타깃 고객이 아닌 고객층이 제품에 반응했을 때의 사례다.
p.155
1. 데이터 디자인 - 질문하기
소풍 갈 때 돗자리를 판매했는데, 왜 30대 이상 남성이 많이 구매했을까?
2. 데이터 디자인 - 문장 쪼개기
- 소풍 갈 때 쓰는 돗자리를 판매했는데 : 제품 사용 상황을 이미 가정하고 판매했는가? 돗자리의 특성이 뚜렷한가?
- 왜 30대 이상 남성이 : 30대 이상 남성은 타깃이 아니었는가?
- 많이 구매했을까? : 다른 고객군에 비해서 얼마나 많이 구매했는가? 처음 기대한 바보다 많이 구매했는가?
p.164-166
1. 데이터 디자인 - 질문하기
사람들이 회사 앞 매장과 집 앞 매장에서 다른 행동을 하지는 않을까? 관광지에 가면 다른 제품을 사거나, 사지 않거나, 평소에 사던 것보다 더 사는 것이 있지 않을까?
2. 데이터 디자인 - 문장 쪼개기
- 사람들이 : 특정 지역에 사는 사람들을 보고 싶은가? 아니면 정말 고객 전체를 대상으로 하는가? 알고 싶은 특정 지역이 있는가?
- 회사 앞 매장과 : 회사로 특정할 수 있는 지역이 있는가? 주상복합건물처럼 규정하기 어려운 지역도 있는가? 회사나 지역 특성보다는, 주중 낮의 구매라고 정의하는 것이 더 낫지 않을까?
- 집 앞 매장에서 : 거주 지역을 중심으로 지역을 구분할 수 있는가? 집 앞이라는 것이 정말 집이라기보다는 회사와 구분되는 개념을 표현한 것이 아닐까? 집이 아니라, 주말의 행동 패턴을 보는 것이 더 나은 분석 방법은 아닐까?
- 다른 행동을 하지 않을까? : 어떤 행동을 말하는가? 특정 제품의 구매인가? 아니면 구매하는 제품의 변화를 말하는가? 혹은 구매 빈도나 주기에 대한 것인가?
- 관광지에 가면 : 관광지를 특정할 수 있는 기준은 무엇인가? 예로, 제주도라고 한다면 제주도 전역을 관광지로 볼 수 있는가? 제주의 특정 지역은 제주도민이 많이 방문하는 곳이 아닐까?
- 다른 제품을 사거나 : 다른 제품이라고 하면, 특정 제품군을 말하는가? 특정 제품의 종류나 사이즈가 다른 것까지 포함하는 것인가? 혹은, 특정 제품의 조합이 있을까?
- 사지 않거나 : 어떤 구매 행동 등을 하지 않는 특징도 있지 않을까? 하는 행동과 하지 않는 행동을 나눌 수 있을까?
- 평소에 사던 것보다 더 사는 것이 있지 않을까? : 안 사던 것들을 사거나 사던 것을 안 사는 게 아니라, 사던 것을 더 많이 사거나 적게 사는 등 변화가 있지는 않을까? 자신이 보고 싶은 행동의 단위를 어떻게 정의할 수 있을까?
p.172
실제로 어떤 액션 아이템을 하기로 결정했다면, 새로운 시작이 이루어지는 일정은 관광지의 특성상 사람들이 몰리거나 몰리지 않는 때로 선택한다. 사람들이 몰릴 때에 하는 것이 임팩트가 있고 큰 성과를 거두기는 한다. 그러나 어떤 경우에는 사전에 제품을 내보이고 사람들의 반응을 수집해, 한 번 더 개선을 하는 것이 필요하다. 비성수기라 하더라도 고객들의 일부 반응을 살피는 기회로 삼을 수 있다. 기업의 상황에 따라 다른 의사결정을 할 수 있다.
p.177
온라인에서도 마찬가지다. 영상을 보거나 구매를 하는 행동도 금요일 밤부터 주말 사이에 달라질 수 있다. 평일 새벽에도 특정 구매가 상승하는 패턴이 나타나기도 하나, 영상을 시청하는 행동 등 시간적 여유가 있어야 하는 일은 주말과 주중 사이 확연히 다른 패턴이 나타난다. 이때 기업은 선택해야 한다. 어떤 행동을 더 많이 하도록 할 것인가, 아니면 하지 않았던 행동을 하도록 유도해야 할 것인가? 정답은 없다. 남의 성공적인 분석 결과를 벤치마크 한다고 해서 성공을 장담할 수는 없다. 인력, 배송, 공간 등 케이스별 상황을 살핀 뒤 결정해야 한다.
p.178~179
1. 데이터 디자인 - 질문하기
내가 올리는 영상을 사람들이 언제 많이 볼까? 언제 영상을 올리는 것이 가장 좋을까?
2. 데이터 디자인 - 문장 쪼개기
- 내가 올리는 : 어떤 플랫폼에 영상을 올리는가? 특정 플랫폼에서 순위에 올라야 하는 상황인가, 아니면 개인 홈페이지인가?
- 영상을 : 어떤 종류인가? 라이브 스트리밍 영상이나 편집 영상을 올리는가? 영상의 길이는 어떠한가?
- 사람들이 : 일반 대중이 찾아서 보게 만들어야 하는가? 정기적으로 구독하는 사람이 있는가? 혹은 구독을 하도록 만드는 것이 더 좋은 상황인가?
- 언제 많이 볼까? : 특정 요일이나 시간대를 정하고 싶은가? 과거에 영상을 올렸던 시기별로 시청자 수가 집계되어 있는가? 시청자 수는 누적값만 있는가, 일자별 증가한 인원 수가 있는가?
- 언제 영상을 올리는 것이 : 업로드 하는 일자에 따라 효과가 달라지는가? 올리는 시간대에 따라 사람들이 시청하는 패턴이 달라지는가? 아무 때나 올려도 시청이 비슷하게 유지되는가?
- 가장 좋을까? : 시청자 수를 올리고 싶은가? 혹은 구독자 모집이나 영상 전파 등 다른 목표가 있는가? 업로드 시기에 대한 분석이 가지고 오는 이득이 있는가?
p.187
인간이 모두 다른 개성을 가지고 있기 때문에, 소비자로서 특정 집단이 발생하지 않는 걸까? 그건 또 그렇다고 할 수 없다. 나는 특정 연령대가 유사한 행동을 보일 가능성이 있다고 생각하는데, 이는 생활 주기가 비슷할 수 있기 때문이다. 예를 들어, '직장에 다니고 초등학생의 자녀를 키우는 워킹맘'이 유사한 생활 습관을 가질 확률은 높다고 생각한다. 단순히 나이가 비슷한 여성이기 때문이 아니라, 어떤 행동을 할 수 있는 여건상의 유사성 때문이다.
데모그래픽에만 집중하는 것보다, 행동의 유사성을 파악하는 것이 훨씬 중요하다. 유사한 연령대에 유사한 행동을 보였던 과거와 달리, 이제 나이나 성별의 제한도 고정관념에 불과해졌다.
p.188~189
1. 데이터 디자인 - 질문하기
우리 매장에서 커피 원두를 구매하는 고객군은 어떤 연령대일까? 어떻게 이 고객들이 원두를 더 많이 구매하도록 할 수 있을까?
2. 데이터 디자인 - 문장쪼개기
- 우리 매장에서 : 매장이 하나인가? 여러 개인가? 온라인 구매도 함께 할 수 있는가?
- 커피 원두를 구매하는 고객군은 : 커피 원두의 종류는 얼마나 되는가? 제품군에 포함된 제품은 몇 종류인가? 그 커피를 모두 하나의 원두로 정의할 것인가?
- 어떤 연령대일까? : 나이가 중요한가? 이러한 질문을 하게 된 특별한 원인이 있는가? 사실은 어떤 특성을 가진 사람들인지 알고 싶어서이지, 연령대 자체가 궁금한 것은 아니지 않을까?
- 어떻게 이 고객들이 : 어떤 방법론을 생각하고 있는가? 홍보나 마케팅 방법을 생각해놓고 있는가? 아니면 제품군의 확장이나 디스플레이의 변화 등을 고려하고 있는가?
- 원두를 더 많이 구매하도록 : 기존에 원두를 구매하던 사람이 더 많이 구매하게 하고 싶은 것인가? 아니면 원두를 사는 고객 특성을 파악해, 유사한 특성을 가진 고객이 더 유입되도록 하고 싶은가?
- 할 수 있을까? : 제품군과 해당 매출 볼륨을 확장하고 싶은지, 아니면 기존 제품군을 판매할 수 있는 고객군을 확보하고 싶은지, 현황을 어떻게 파악하고 있는가?
p.193
p.210~212
1. 데이터 디자인 - 질문하기
이번 시즌 제품은 왜 바로 매진되지 않았을까? 지난 시즌에는 1시간 만에 매진되었는데, 왜 이번에는 하루가 지나도 제품이 남았을까?
2. 데이터 디자인 - 문장 쪼개기
- 이번 시즌 제품은 왜 : 이번 시즌 제품의 카테고리는 잘 정리되어 있는가? 시즌별로 판매되는 것과 상시 판매되는 제품 모두를 분석하려고 하는가? 아니면 시즌 제품만 한정적으로 분석할 것인가?
- 바로 매진 되지 않았을까? : 제품 발주량은 얼마나 되는가? 발주량이 전량 소진되는 것이 목적이었는가? 평소 판매되는 양보다 더 많은 제품을 발주한 것은 아닌가?
- 지난 시즌에는 : 이번 시즌과 대비할 수 있는 과거 시즌이 있는가? 같은 기간, 같은 시간대에 판매되었나? 차이점이 있다면 무엇인가?
- 1시간 만에 매진되었는데 : 한 개의 제품에 대한 것인가, 전체 시즌 제품에 대한 것인가? 1시간이라는 시간은 어떻게 측정되었는가? 판매 추이는 어떠했는가?
- 왜 이번에는 : 지난 시즌과 이번 시즌 간 차이를 분석할 만하나 주제가 결정되었는가? 같은 장소, 같은 고객군을 대상으로 보고 있었는가?
- 하루가 지나도 : 개점한 지 24시간이 지났는가? 며칠 더 판매할 수 있는 이벤트인가?
- 제품이 남았을까? : 제품 발주량이 같은가? 같은 제품을 판매한 것인가, 아니면 시즌에 따라 제품 자체가 달라진 것인가?
'Growth' 카테고리의 다른 글
Data Driven Decision을 위한 플랫폼 구축기 (0) | 2022.06.28 |
---|---|
커머스 분석 툴 시장 (0) | 2022.06.27 |
CRM (0) | 2022.06.14 |
How to Use Amplitude for Marketing Analytics (0) | 2022.06.12 |
토스ㅣSLASH 22 - Data Scientist는 어떻게 비즈니스에 기여할 수 있을까? (0) | 2022.06.10 |
댓글