본문 바로가기
Growth

엑셀, R, 파이썬으로 시작하는 데이터분석

by Diligejy 2022. 12. 3.

p.10

연구에 따르면 배운 내용과 이미 알고 있는 내용을 연관시키는 것이 강력한 학습 방법이라고 합니다. 피터 C 브라운의 [어떻게 공부할 것인가]에서도 이것을 다음과 같이 언급하고 있습니다.

 

"새로 공부하는 내용이 이미 알고 있는 지식과 어떻게 연관되는지 더 많이 설명할 수 있게 될수록 새로 공부하는 내용을 더 잘 이해하게 되고, 이러한 연관관계를 더 많이 만들어낼수록 나중에 기억할 가능성이 커집니다."

 

p.30

열을 구분하면 변수 유형을 분류하는 데 도움이 됩니다. 데이터를 분석할 때는 변수 유형을 분류하는 것이 중요합니다. 변수 유형은 다소 임의적으로 분류하며 분석의 목적과 상황에 따라 분류 기준을 변경할 수 있습니다. 

 

p.34

변수가 어떤 유형인지 이해하는 빠른 방법은 변수가 가지는 고윳값 개수를 확인하는 것입니다. 엑셀의 필터 미리보기 기능을 사용하면 변수가 가지는 고윳값 개수를 확인할 수 있습니다.

 

p.56

주사위가 떨어지면 1에서 6 사이의 숫자가 표시됩니다. 이 모든 결과의 집합을 표본공간(sample space)이라고 합니다. 

 

p.56

주사위 던지기에서 일반적으로 알 수 있는 확률과 관련된 질문은 '주사위를 던져서 4가 나올 확률은 얼마인가?'입니다. 이때 하나의 사건만 따로 보고 있기 때문에 이를 주변확률(marginal probability) 또는 비조건부확률(unconditional probability)이라고 합니다.

 

그렇다면 '주사위를 굴려서 1이 나오고 다시 던졌을 때 2가 나올 확률은 얼마인가?'와 같은 질문은 어떨까요? 이 질문에 답하려면 결합확률(joint probability)을 알아야 합니다. 때때로 두 사건의 확률을 연구할 때 한 사건의 결과는 알지만 다른 사건의 결과는 알지 못합니다. 이것을 조건부 확률(conditional probability)이라고 하며 베이즈 정리를 사용하여 계산할 수 있습니다. 

 

p.57

지금까지 무엇이 주사위 던지기를 무작위 실험으로 만드는지 배웠고 실험의 시행이 가질 수 있는 값의 표본공간을 살펴보았습니다. 또한 각 결과에 대한 확률의 합이 1이어야 한다는 사실을 알아보았습니다. 그렇다면 각 결과의 상대적인 확률은 얼마일까요? 이 질문에 답하려면 확률분포(probability distribution)를 공부해야 합니다. 확률분포는 사건이 취할 수 있는 결과와 각 결과가 얼마나 흔한가를 나열한 것입니다. 

댓글