본문 바로가기
경영/커리어

문과생 데이터 사이언티스트 되다

by Diligejy 2020. 10. 24.

데이터사이언스의 세계를 잠시 엿보고 싶다면

https://coupa.ng/bLw6iz

 

문과생 데이터 사이언티스트 되다:데이터를 비즈니스에 활용하고 싶은 이들을 위한 가장 쉬운

COUPANG

www.coupang.com

공지 : 파트너스 활동을 통해 일정액의 수수료를 제공받을 수 있습니다.

 

p.23

영수증은 대상에 따라 다른 데이터로 변한다. 회사에서는 매출로, 가게에서는 매상으로, 소비자에게는 가계부로 바뀔 수 있다.

 

p.75

"요즘 사람들이 이 요리 많이 먹더라!"라는 얘기를 했다고 해보자. '요즘'은 며칠, 몇 주, 몇 개월 혹은 몇 년일 수 있다. '사람들'은 어떤 그룹인지, 동네인지, 한국인지, 전 세계인지 그리고 '많이'는 얼마나 되는지, 다른 요리와 대비해 많이 먹는지, 아니면 그 요리가 특정 기간보다 훨씬 더 많이 팔리고 있는지, '이 요리'는 딱 이 가게에서 파는 것인지, 어떤 범주의 요리인지 등 고작 한 문장인데 정의해서 증명해야 할 것이 많다.

 

p.90~91

마케터가 "사람들이 이 제품을 사는 주기가 길어지는지 짧아지는지 알고 싶어요"라고 말했다고 하자. '구매주기'에 대한 지표가 없기 때문에 엔지니어는 '알 수 없다'고 대답한다.

 

마케터가 진짜로 원한 것은 제품의 구매 주기가 길어지고 있다면(자주 사지 않는다면) 구매 주기가 짧아지도록 프로모션을 진행하고 싶다는 의미였을 거이다. 이 의미를 전달하지 않았기 때문에 "네" 혹은 "아니요"의 답변밖에 들을 수 없었다. 또 '주기'라는 것은 첫 번째 구매와 두 번째 구매 사이만이 아니라 횟수에 따라서도 달라질 수 있어 계산하기 까다로운 데다가 단순하게 평균을 낼 수 있는 숫자가 아니다. 1번만 산 사람을 제외한 중복 구매자 중 몇 회까지를 재구매 주기에 포함할지, 10번을 산 사람이 처음엔 10일 만에 샀다가 다음엔 2일 만에 샀다가 다시 7일 만에 샀다면 주기가 짧아진 것인지 길어진 것인지 판단하기 애매한 무수한 경우의 수가 생기기 때문이다.

 

따라서 데이터를 어떻게 활용할지 충분히 소통하지 않고 단순히 데이터를 요청하면 단답식 대화로 끝날 수밖에 없다. 데이터가 필요한 마케터와 엔지니어가 이 데이터로 어떤 결과를 이끌어낼지 데이터의 목적을 논의하면서 '주기'란 무엇인지, '짧다와 길다'의 기준은 무엇인지 정의하는 과정이 있다면 데이터를 비즈니스에 의미있게 활용할 가능성이 높아진다.

 

p.113

소상공인진흥공단(www.semas.or.kr)에서 제공하는 무료 데이터를 통해서도 카드사나 통신사 등과 협력해 통계 처리한 정보를 볼 수 있다. 특정 통신사와 카드사의 데이터이다 보니 전체 인구를 반영하지는 못하지만, 통계 처리한 데이터가 대표성이 있을 것이라는 가정하에 사용하는 데에는 무리가 없다.

댓글