본문 바로가기
경영/E-BIZ

데이터 읽기의 기술

by Diligejy 2019. 12. 7.
데이터 읽기의 기술
국내도서
저자 : 차현나
출판 : 청림출판 2019.10.30
상세보기

p.37
소비자에 대한 이해는 교묘한 상술과는 다르다. 상술은 소비자를 속여 더 많은 이윤을 얻고자 하는 쪽에 가깝다. 그러나 소비자를 진심으로 이해하고자 하면, 제품과 서비스에 소비자의 니즈가 담긴 인사이트를 반영하게 되고, 자연스럽게 소비자는 그 브랜드를 좋아하게 된다.

p.42~43
빅데이터 분석을 하려면 당연히 최대한 작은 매출 단위가 좋다. 나는 개인적으로 영수증 데이터를 좋아한다. 다음 장에서 보듯이, 영수증 단위의 데이터를 가지고 있으면 분석에 활용할 수 있는 가능성이 증폭된다. 

판매한 매장, 판매한 제품, 판매한 연월일시, 구매한 사람까지 연결할 수 있는 단위는 영수증뿐이다. 그 이상으로 집계된 단위는 결국 그냥 집계 데이터로 존재하게 되며 추정을 위한 단서로만 사용될 수 있다.

편리하게 매출 데이터를 쌓아놓고 사용자가 원하는 방식으로 데이터를 볼 수 있도록 도와주는 비즈니스 인텔리전스 툴로 보여주고 있다고 해서 만족하고 있는가? 통계 처리한 데이터는 기본이다. 빅데이터 분석을 위해서는 통계 처리 전 로그 단위의 데이터가 오히려 가치 있을 수도 있다.

매출 데이터가 어떻게 쌓이고 있는지 확인하자. 내가 보고 있는 일 단위, 월 단위의 데이터는 낱개 데이터의 합만 내면 되는 간단한 숫자다. 수기로 했던 단순한 수치 집계를 자동으로 하기 위해 기술의 도움을 받을 수 있는 시대가 되었다. 이것이 빅데이터 분석은 아닐 수 있다. 물론 사칙연산을 제대로 하는 것도 중요한 분석이지만 그 사칙연산을 하기 위해 빅데이터 장비, 툴, 인력이 별도로 필요한지는 생각해보아야 한다. 깔끔한 통계가 필요하다면 기존 업무를 제대로 하면서 자동화하는 것에 집중하면 된다. 

p.47
영수증엔 육하원칙 중 '왜'를 제외한 거의 모든 정보가 담겨 있다. '왜'는 기업이 통찰력으로 발견하는 원리다. 소비자가 '왜' 이런 행동을 했는지 알면 다음에도 비슷하게 행동할 가능성이 있다는 것이다. 소비자를 분석한다는 것은 왜 소비자가 이 제품을 사거나 사지 않는지 알기 위해 퍼즐 조각을 맞춰나가는 것과도 비슷하다.

p.49
멤버십이 갖는 의미 중 '데모 정보를 알 수 있다'라는 것보다 더 중요한 것이 있다. 이 사람이 '동일한 개인unique임'을 알게 해준다는 점이다.

p.49
같은 연령, 같은 성별의 사람이 모두 같지는 않다. 이제 'A'라는 한 명의 사람이 언제, 어디서, 무엇을, 어떻게, 몇 번을 구매하는지 연결해서 보는 것이 더 의미있는 시대가 되었다. 개인의 성향이 비슷하고 생활 패턴도 비슷한 그룹이 존재할 수 있는 것이다.

p.50
멤버십에 가입한 개인정보가 항상 필요한 것은 아니다. 모든 개인정보가 암호화되어 'DQHOXLDOELF블라블라 씨'여도 상관없다. 그가 한 명의 동일한 개인임을 확인하는 것이 멤버십의 핵심적인 역할이다.

p.52
점점 성별과 나이의 구분이 무색해지고 있다. '제 나이다운', '여자다운', '남자다운' 제품의 경계가 사라진다. 그래서 오히려 개인의 성향에 맞춘 추천, 혹은 행동 속성에 따른 군집화가 적합하다. 특정 기준을 가지고 고객을 집단화하는 것이다.

p.54~56
사용자 기반의 협업적 필터링에서는 사람들의 유사성을 계산해 추천한다. 만약 A가 구매한 목록과 B가 구매한 목록이 비슷하다면, A는 샀지만 B가 아직 사지 않은 것을 B에게 추천하는 방식이다. 그러나 당시엔 이 방식의 계산에 시간이 걸리는 편이라 고객 전체에 대해서 계산하기 어려웠다. 

아마존의 그레그 린든은 새로운 해결책을 찾아냈는데, 바로 상품 기반의 협업적 필터링이다. 사람보다 수가 적은 상품 간의 유사성을 계산하는 것이다. 예를 들어 A상품을 산 사람과 B상품을 산 사람이 많이 겹치면 A와 B는 유사한 상품이라는 식으로 추천의 규칙을 만드는 것이다.

이렇게 상품을 기반으로 한 추천 방식은 좀 더 용이한 편인데, 특히 콘텐츠는 취향에 기반을 둔 추천을 하기 참 좋다. 영화 추천 플랫폼 왓챠플레이는 광고에서 대놓고 말한다. "~~를 좋아하면서 XX를 보지 않았다는 것은, 키스는 했는데 뽀뽀는 안 했다는 것"이라고. 광고에서 이렇게 말할 수 있는 자신감은 바로 데이터에 기반을 둔 취향 분석에서 나온다.

제품에 기반을 둔 분석은 기존 제품의 판매 전략뿐만 아니라 신제품을 만드는 데도 매우 도움이 된다. 기존 고객이 좋아하는 취향을 기반으로, 우리 브랜드가 갖추지 못한 '비어있는 시장'을 발견할 수도 있따. 혹은 새로운 제품을 론칭할 때 '이 취향을 가진 고객군은 반드시 이 신제품을 좋아할 가능성이 높다'라고 확신할 수 있게 된다.

p.57
시간으로 쪼갠 데이터를 확인해야 목표 실적을 적절하게 분배할 수 있다. 무조건 목표를 준다고 달성할 수 있는 건 아니다. 어느 시즌에 얼마쯤 달성해야 할지 파악하고 있어야 한다. 어느 시간대를 공략해서 판매를 촉진할 것인가? 좀처럼 사람이 모이지 않는 시간대를 포기할 것인가? 아니면 포기하지 않고 어떻게든 사람을 끌어모을 것인가?

p.64
영수증의 고유 번호가 다른 모든 데이터와 연결될 수 있도록 단서를 만들어야 한다. 예를 들어 하나의 영수증 번호가 고객 고유 번호와 연결되어 있으면 멤버십 데이터와 연계 분석이 가능해진다(who). 영수증 번호가 매장 번호와 연결되어 있으면 매장의 특성과 연계 분석할 수 있다(where). 영수증 번호가 제품 고유 번호와 연결되어 있으면 제품 패턴과 연결할 수 있다(what). 영수증 데이터를 일자별 프로모션이나 공휴일 등으로 나누어볼 수 있는 시계열 데이터와 연결해 시기를 분석할 수도 있다(when).

p.80~81
많은 프로젝트에서 데이터의 기준을 만드는 일을 간과한다. 완벽한 신생 회사, 철저한 신규 제품의 경우 과거 사례가 없으니 그럴 수도 있다. 그렇지만 어떻게든 다른 회사와 비교를 해서라도 비교점을 만드는 것은 필요하다. 실험에서는 '대조군', 아무런 처치를 하지 않은 집단이 있어야 실험의 효과를 제대로 알 수 있다. 데이터 분석과 설문 조사도 마찬가지다. 기준 없이는 설문의 결과를 제대로 보여줄 수 없다.

p.91
사무실에서 일하는 나와 제주도 관광지에서 휴가를 보내는 나는 같은 사람일까? 물론 물리적으로는 같은 사람이지만, 생각하는 방식과 구매하는 제품은 완전히 달라질 수 있다. 기업은 이 점을 기억해야 한다. 소비자는 어떤 공간, 어떤 맥락에 있느냐에 따라 전혀 다른 행동을 할 수 있다. 기업의 지역 특화 제품은 이러한 소비자의 마음을 이해하며 만들어야 한다. 만약 지역 특화 제품이 잘 팔리지 않는다면, 그 제품을 사야 했던 사람들이 가진 욕구를 왜 충족시키지 못했는지 다시 생각해보자.

p.97~98
상권 분석의 목적을 명확히 하라. 실제 출점을 위한 것인지, 폐업을 위한 것인지, 특정 상권의 매출 성장이나 부진의 원인을 찾는 것인지, 잘나가는 매장의 특징을 찾기 위한 것인지, 데이터의 목적을 명확히 한 뒤에 분석 방법을 고민해야 한다. 

'경영 > E-BIZ' 카테고리의 다른 글

비트코인 제국주의  (0) 2020.08.16
딥러닝 레볼루션  (0) 2020.05.24
로그데이터로 유저 이해하기를 보고  (0) 2019.05.24
데이터를 철학하다  (0) 2019.02.10
온라인 - 다음 혁명  (0) 2019.01.14

댓글