본문 바로가기
Growth/통계

파이썬 비즈니스 통계분석

by Diligejy 2024. 2. 4.

 

 

p.4~5

시잠점유율 (Market Share)은 여전히 기업에게 중요한 성과지표임에도 불구하고, 시장점유율이라는 외형적인 지표만으로 기업의 지속적인 성장을 보여주지 못한다. 최근 기업의 마케팅 목표는 시장점유율뿐만 아니라, 내실 있는 기업경영 지표로서 고객점유율 (Customer Share)을 높이는 데 있다. 고객점유율은 한 고객이 소비할 수 있는 특정 상품/서비스 영역의 총 소비량 중에 자사의 상품/서비스가 차지하는 비율을 의미한다. 시장점유율은 자사의 총 판매량 정보만 알면 쉽게 산출이 가능하지만, 고객점유율은 고객 개개인의 구매력 정보를 획득하거나, 고객들의 잠재소비량을 통계적으로 추론해야 한다. 고객점유율을 기업의 중대한 핵심성과지표로 활용하기 위해서는 막연한 개념뿐만 아니라 구체적인 데이터분석 역량을 보유하고 있어야 한다. 

 

p.9

 

- T검정

 

특정 수치형 변수에 대해 두 집단간의 차이를 통계적으로 검증할 때 주로 사용하며, 단일표본 t-test, 독립표본 t-test, 쌍체표본 t-test가 있다.

 

단일표본 t-test는 예상하는 평균값이 통계적으로 유효한지 검증할 때 사용하는데, 예를 들어, 특정 브랜드의 구매 평균 연령이 32세라고 알려졌을 때, 과연 그러한지 통계적으로 검증할 때 사용할 수 있다.

 

독립표본 t-test는 완전히 독립적인 두 집단의 평균 차이가 통계적으로 유의한지 판단할 때 사용하며, 가령 멤버십 프로그램 가입 고객군과 비가입 고객군의 매출액이나 구매빈도와 같은 데이터의 차이를 통계적으로 검증하고자 할 때 활용할 수 있다.

 

끝으로 쌍체표본 t-test는 동일하지만 특정 사건이나 실험에 의해 두 개의 다른 시점으로 분류될 수 있는 그룹들간의 평균 차이가 통계적으로 유의한 지 판단할 때 사용한다. 가령, 현재 멤버십 프로그램 가입 고객들을 멤버십 가입 이전과 가입 이후로 구분하고, 매출액이나 구매빈도의 차이를 검증하는 것은 매우 의미있는 일일 것이다.

 

 

p.10

한편, 상관관계는 개별 변수들간의 연관성뿐만 아니라 여러 변수들로 구성된 변수그룹들간의 연관성 파악에도 적용될 수 있는데, 이러한 상관분석 기법을 정준상관분석이라고 한다. 가령, 서비스만족도와 가격만족도로 구성된 고객만족 변수그룹과 구매금액과 구매빈도로 구성된 고객행태 변수그룹 간의 연관성을 분석하고자 할 때 정준상관분석을 활용할 수 있다.

 

p.10

범주형 데이텁 분석은 명목척도로 구성된 변수들간의 연관이 있는지 혹은 독립인지를 판단하는 통계적 검정방법으로, 흔히 카이제곱(Chi-Square) 검정이라고도 불린다. CRM이나 마케팅에서 특히 활용도가 높은 카이제곱 검정은 행(row)과 열(column)로 구분되는 분할표 상의 각 셀에 나타나는 빈도의 차이를 바탕으로 행과 열의 분류 변수들간의 연관성을 통계적으로 규명한다. 가령, 행을 매장지역 분류로, 열을 상품유형 분류로 놓은 후 지역별 각 상품에 대한 구매빈도를 교차표로 만들면 매장지역과 상품유형이 서로 연관되어 있는지 객관적으로 판단할 수 있다. 

 

p.10

신뢰성이란 일관성과 같은 의미이므로 신뢰성 분석은 특정 변수의 측정값들이 일관된 수준으로 나타나고 있는지를 판단하는 분석기법이다. 신뢰성 분석은 보통 고객서베이 데이터에 대한 다변량 통계분석을 하기 위한 사전분석 단계에서 많이 사용된다. 가령, 고객들이 인지하는 구매가치 수준을 품질수준과 가격수준, 그리고 편의성 수준이라는 측정 변수들에 의해 평균된 점수라고 한다면 구매가치 점수를 나타내기 위해서는 우선 하위 세 가지 변수들의 측정값이 어느 정도 일관된 수준으로 측정되어야 한다는 전제를 내포한다.

 

p.20

독립사건과 배반사건은 서로 다른 의미라는 것을 유의해야 한다. 두 사건이 배반사건이라 함은 A 교집합 B의 확률이 0으로서 두 사건이 동시에 일어날 확률이 0인 경우를 말한다. 반면, 독립사건은 두 사건이 동시에 일어날 확률이 각각의 사건이 일어날 확률의 곱으로 주어지는 경우를 말한다. 따라서, P(A) > 0, P(B) > 0이라고 하면 두 사건은 독립사건이면서 동시에 배반사건일 수는 없다.

댓글