본문 바로가기

전체 글3300

슈퍼 예측 - 그들은 어떻게 미래를 보았는가 p.17 야구단을 운영하는 사람들은 특정 선수를 스카우트할 때 그 선수의 기록을 반드시 검토한다. 2번, 3번 꼼꼼히 확인하지 않고는 절대로 지갑을 열지 않는다. 팬들도 경기를 볼 때 스코어보드나 TV 화면 아래쪽에서 선수의 기록을 확인한다. 그런데 야구 경기보다 훨씬 중요한 결정을 내릴 때는 아무렇지도 않게 이런 무지를 당연히 여긴다. 적어도 예측하는 사람들에 관한 한은 그렇다. p.26~27 우리는 아주 무기력한 한 사람의 행동이 우리 모두에게 다양한 방식으로 영향을 미치는 세계적 파급 효과의 물결 속에 살고 있다. 캔자스시티에 사는 어떤 여성은 튀니지와 아무런 연관이 없다고 생각할 것이다. 하지만 그녀가 화이트먼 공군기지 소속의 미 공군 항법사와 결혼했다면, 그래서 잘 모르는 튀니지 청년의 행동이 .. 2024. 2. 18.
SQL로 시작하는 데이터 분석 p.20 분석은 단순히 적절한 방법론을 사용해 정확한 숫자를 만들어내는 일 이상을 의미합니다. 분석이란 호기심을 갖고 '왜' 그 숫자가 나왔는지 질문을 던지는 일입니다. 또한 다양한 패턴과 이례적인 현상들 그리고 비즈니스가 어떻게 움직이고 인간이 어떻게 행동하는지 이해하기 위한 단서를 찾고 해석하는 일입니다. p.29~30 분석 업무는 항상 질문을 던지는 데서 시작합니다. 예를 들어, '신규 고객이 얼마나 유입됐는가?', '판매 추이가 어떠한가?', '왜 어떤 고객은 한번 서비스를 이용한 후 다시 돌아오지 않는 반면, 어떤 고객은 지속해서 서비스를 사용하는가?' 등의 질문이 생기고 나면 데이터가 어디에서 나오고 어디에 저장되는지, 분석 계획은 무엇이며 결과를 어떻게 발표할지 생각해야 합니다. p.36 열.. 2024. 2. 17.
데이터 과학자의 가설사고 p.19 데이터 과학자는 데이터를 파악할 때 데이터를 읽는 목적과 데이터에 있는 배경을 생각합니다. 예를 들어 편의점 매출 데이터를 파악할 때도 '왜 그 상품이 이 시간대에 팔렸는가를 생각하면서 데이터와 마주하지요. p.28-29 세 점포의 평균값은 같지만, 막대 그래프로 보면 경향이 다르다는 사실을 알 수 있습니다. A점포는 평일 매출이 적고, 주말 매출이 많습니다. 근처에 돔구장이 있기 떄문에 주말에 개최되는 이벤트의 영향으로 매출이 늘어난 것으로 추측됩니다. A점포는 주말 매출이 매우 크기에 일주일 평균 판매 개수도 그 영향으로 커졌습니다. 이에 반해 B점포는 주말에 비해 평일 매출이 많습니다. B점포는 오피스 거리에 있기 떄문에 근처 사무실에 근무하는 사람이 많이 구입할 것으로 추측할 수 있습니다.. 2024. 2. 17.
사무실의 도른자들 p.35-36 강약약강형은 단 하나의 목표를 향해 움직인다. 수단과 방법을 가리지 않고 정상으로 올라가는 것. 그러기 위해 이들은 자기와 동등하거나 아래에 있는 사람들을 경쟁자로 취급한다. 상사가 보지 않는 곳에서는 예의바른 허울을 벗어던진다. 사람의 성격 특질 중에 사회비교 지향성(social comparison orientation)이라는 것이 있다. 이는 자연스럽게 자신을 다른 사람과 비교하는 정도를 일컫는다. 누구에게나 있는 이 특질이 남들보다 유독 강한 사람도 있다. 소매업에서 일할 때, 나 역시 내 매출액을 데이브의 매출액과 비교했다. 고등학교 동창들의 소셜미디어 계정을 염탐하며 나보다 얼마나 잘 사는지 저울질하기도 했다. 하지만 대부분의 경우 나는 적당한 선에서 그만둘 줄 안다. 남이 나보다.. 2024. 2. 16.
세컨드 브레인 p.16 머리는 아이디어를 생각하는 곳이지 보관하는 곳이어선 안 된다. - 데이비드 앨런, 생산성 분야 권위자 2024. 2. 11.
Michael Crawley - Introduction to Statistics using R p.1 The truth is that there is no substitute for experience: the way to know what to do is to have done it properly lots of times before. p.1~2 It is essential, therefore, tha tyou know: - which of your variables is the response variable? - which are the explanatory variables? - are the explanatory variables continuous or categorical, or a mixture of both? - what kind of response variable have y.. 2024. 2. 10.