본문 바로가기
자기계발

데이터는 어떻게 인생의 무기가 되는가

by Diligejy 2023. 8. 15.

 

p.16~17

수학자이자 저술가인 크리스티안 러더는 데이트 앱인 오케이큐피드에서 데이트 신청을 많이 받는 사람들의 특징을 알아내기 위해 수천만 명의 데이터를 분석했다. 그 결과는 별로 놀랍지 않았다. 데이트 상대로 선호도가 가장 높은 사람들은 아름다운 외모를 가지고 태어난 사람들이었다. 세상의 모든 브래드 피트와 나탈리 포트먼들.

 

하지만 러더는 데이터 더미 속에서 신기하게도 선호도가 높은 다른 집단을 발견했다. 그들은 외모가 매우 특이했는데 예컨대 머리칼이 파란색이거나, 보디아트를 했거나, 독특한 안경을 썼거나, 머리를 빡빡 깎은 사람들이었다.

 

왜 그런 사람들이 인기가 많을까? 평범하지 않은 사람들이 데이트 신청을 많이 받은 가장 큰 이유는 대다수 사람이 그들에게 특별한 매력을 느끼지 않거나 그들이 매력적이지 않다고 판단하지만 어떤 사람들은 그들에게 강하게 이끌리기 때문이다. 그리고 데이트에서는 그런 끌림이 가장 중요하다.

 

당신이 넋이 나갈 정도로 아름다운 사람이 아니라면 데이트의 세계에서 최고의 전략은 "예를 많이 받고, 아니요도 많이 받지만, '그저 그렇다'는 아주 조금 받는 것'이라고 러더는 말한다. 러더는 이런 전략을 사용할 때 메시지를 70퍼센트 더 받는다는 사실을 발견했다. 데이터는 이렇게 말한다. '당신의 극단적인 모습을 보여주어라. 그러면 어떤 사람들은 당신이 극도로 매력적이라고 여긴다.'

 

p.19

당신이 화가 지망생인데 성공의 기회를 잡지 못하고 있다고 가정하자. 당신은 작품 활동에 도움이 되는 책이라면 모두 사들이고, 친구들에게 조언도 구한다. 당신은 작품을 수정하고, 수정하고, 또 수정한다. 그러나 어떤 방법도 통하지 않는다. 무엇을 잘못하고 있는지 모르겠다.

 

빅데이터가 당신의 실수를 잡아냈다.

 

새뮤얼 P. 프레이버거는 최근에 화가 수십만 명의 경력에 대한 연구를 진행한 결과, 왜 어떤 사람은 화가로 성공하고 어떤 사람은 성공하지 못하는지에 관한 숨은 패턴을 찾아냈다. 그렇다면 이름이 널리 알려진 화가들과 무명으로 남은 화가들을 가르는 비밀은 무엇인가?

 

비밀은 화가들이 작품을 선보이는 방식에 있었다. 데이터에 따르면 결정적인 성공을 거두지 못한 화가들은 한두 군데에서 계속 전시회를 여는 경향이 있었다. 반면 큰 성공을 거둔 화가들은 다양한 장소에 작품을 전시해 성공의 기회를 잡을 수 있었다. 

 

지금까지 예술가로서 성공하려면 얼굴 비추기가 중요하다고 이야기한 사람은 많았다. 하지만 데이터과학자들이 발견한 성공의 비결은 '다양한 장소에' 얼굴을 비추는 것이다.

 

p.21~22

야구팀들은 번트를 얼마나 많이 사용해야 할까? 야구 통계 전문가들은 번트를 많이 줄여야 한다고 말했다. 도루는 얼마나 많이 해야 할까? 거의 하지 말아야 한다. 출루를 많이 하는 선수들은 얼마나 가치가 있을까? 팀이 생각하는 것보다 더 큰 가치가 있었다. 야구팀들은 누구를 선발해야 하나? 대학팀의 투수들이다. 제임스의 작업에 흥미를 느낀 사람은 우리 아버지 말고도 또 있었다. 야구선수였다가 야구단 임원이 된 빌리 빈도 빌 제임스의 열렬한 팬이었다. 그래서 빌리 빈은 오클랜드 애슬레틱스의 감독이 됐을 때 빌 제임스의 야구 데이터 분석을 팀 운영에 도입하기로 했다.

 

그 결과는 놀라웠다. <머니볼>이라는 책과 영화에 나온 유명한 이야기처럼, 오클랜드 애슬레틱스는 선수들의 연봉 총액이 가장 낮은 팀들 중 하나였는데도 2002년과 2003년에 플레이오프에 진출했다. 그리고 그 때부터 야구에서 통계 분석의 역할이 갑자기 커졌다. "머니볼 A(애슬레틱스)보다도 더 머니볼스러운 팀"으로 불렸던 탬파베이 레이스는 2020년에 선수들의 연봉 총액이 세 번째로 낮은 팀이었는데도 월드시리즈에 진출했다. 

 

게다가 '머니볼'의 원칙들과 그 원칙들의 강력한 전제가 되는 '데이터가 우리의 편견을 수정하는 데 유용하다'는 생각은 다른 여러 영역에도 변화를 일으켰다. 다른 스포츠를 예로 들어보자. NBA 농구팀들은 모든 슛의 경로를 기록하는 분석법에 점점 많이 의존하고 있다. 3억 개의 슛에서 얻은 데이터를 분석한 결과, 그 슛들이 최적의 슛과 거리가 멀다는 사실이 발견됐다. NBA에서 점프슛을 하는 선수들은 평균적으로 슛이 너무 길어서 실패할 확률보다 너무 짧아서 실패할 확률이 두 배 높았다. 그리고 선수들이 코너에서 슛을 할 때는 바스켓 뒤쪽의 백보드를 벗어나 옆으로 빗나갈 확률이 높았따. 아마도 공이 백보드에 부딪힐 것을 지나치게 염려한 탓일 것이다. 농구선수들은 그런 정보를 활용해서 편향을 교정하고 점수를 더 많이 올릴 수 있었다. 

 

실리콘밸리의 기업들은 대부분 '머니볼' 원칙을 토대로 설립됐다. 내가 예전에 데이터과학자로 일했던 기업인 구글은 중요한 결정을 할 때 데이터의 힘을 확고하게 신뢰한다. 구글이 매번 숙련된 디자이너들의 직관을 무시하고 데이터를 더 선호했기 때문에 어느 디자이너가 구글을 그만뒀다는 이야기는 유명하다. 그 디자이너에게 결정타가 됐던 일은 지메일에 41가지 색조의 파란색으로 만든 광고 링크를 삽입해서 클릭 수가 가장 많은 색을 알아보는 실험이었다. 그 디자이너는 속이 터졌겠지만, 그 데이터 실험은 구글에 매년 약 2억 달러의 광고 수익을 추가로 확보해주었다. 1조 8,000억 달러 규모의 기업으로 성장하는 동안 구글은 데이터에 대한 믿음을 철회한 적이 한 번도 없었다. 구글의 전 CEO 에릭 슈미트는 그 믿음을 이렇게 표현했다. "우리는 신을 믿는다. 신이 아닌 사람들은 모두 데이터를 가져와야 한다."

 

p.28~29

최근의 한 연구에서 영업사원의 감정 표현이 판매량에 끼치는 영향을 분석했다. 

 

데이터세트 - 라이브 방송으로 상품을 판매하는 플랫폼에서 이루어진 9만 9,451건의 상품 판매, (오늘날 사람들은 아마존 라이브와 같은 서비스를 통해 상품을 구입할 일이 점점 많아진다. 라이브 방송을 이용하면 동영상을 통해 잠재 고객들에게 상품을 홍보할 수 있다.) 연구자들은 모든 상품 판매 방송의 동영상과 방송 후 그 상품의 판매량에 관한 데이터를 확보했다. (또 그들은 판매된 상품, 그 상품의 가격, 그리고 무료배송 여부에 관한 데이터도 가지고 있었다.)

 

방법 - 인공지능과 딥러닝. 연구자들은 동영상의 6,232만 개 장면을 데이터로 변환했다. 구체적으로 말하면 인공지능을 사용해 영상 속 영업사원의 감정 표현을 부호화했다. 영업사원들은 화가 나 보였나? 불쾌해 보였나? 겁을 먹은 것처럼 보였나? 놀란 표정이었나? 슬펐나? 아니면 행복해 보였나?

 

결과 - 연구자들은 영업사원의 감정 표현이 상품 판매량을 예측하는 주요 지표라는 사실을 발견했다. 놀라운 결과는 아니지만, 영업사원이 분노나 혐오와 같은 부정적 감정을 표현했을 때는 상품 판매량이 적었다. 그러니까 노여움은 판매에 도움이 안 된다. 조금 더 놀라운 사실. 영업사원이 행복이나 놀라움과 같은 긍정적인 감정을 강하게 표현했을 때는 판매량이 더 적었다. 그러니까 기쁨도 판매에 도움이 안 된다. 판매량을 늘리기 위해서는 영업사원이 흥분을 가라앉혀야 한다. 영업사원이 웃음 대신 덤덤한 표정을 지었을 때 상품 판매량의 증가 효과는 무료배송 혜택의 두 배 정도에 달했다.

 

때로는 상품을 판매하기 위해 상품에 대한 당신의 열정을 덜 표현해야 한다. 그러면 안 될 것 같지만, 데이터는 그것이 옳은 전략이라고 말한다.


p.35

비밀 하나. 부자는 어떤 사람들인가? 돈을 더 많이 벌고 싶은 사람 입장에서는 이걸 안다면 분명 도움이 될 것이다. 하지만 부자가 어떤 사람들인지를 안다는 것은 쉬운 일이 아니다. 부유한 사람들은 대개 자신이 부유하다는 사실이 남들에게 알려지기를 바라지 않기 때문이다.

 

최근의 한 연구는 새롭게 전산화된 세금 납부 기록을 활용해 지금까지 진행된 부자들에 관한 연구 중에서 가장 광범위한 연구를 수행했다. 연구 결과 미국의 전형적인 부자는 IT기업 거물도, 기업의 임원도, 당신이 자연스럽게 떠올렸을 법한 그 어떤 사람도 아니었다. 연구자들의 표현을 빌리면 미국의 전형적인 부자는 "동네 기업의 사장님"들이었다. 예를 들어 "자동차 영업사원(또는) 주류 도매업자"같은 사람들. 아무도 예상 못했던 결과가 아닌가?

 

p.44~45

연애의 성공을 가장 잘 예측하는 변수는 무엇일까? 공통의 가치관보다 공통의 관심사가 더 중요할까? 섹스 취향은 장기적으로 얼마나 중요할까? 자기와 성장 배경이 비슷한 사람과 사귀면 더 행복할까?

 

연구자들을 모으고 데이터를 수집하고 분석하는 작업이 끝나자, 조엘은 연애과학의 역사를 통틀어 가장 흥분되는 프로젝트의 결과를 공개할 준비가 됐다.

 

조엘은 2019년 10월에 캐나다 워털루대학교에서 다음과 같은 직설적인 제목으로 강연하기로 했다. '우리가 사람들의 애인 선택을 도와줄 수 있을까?'

 

어떤 답이 나왔을까? 조엘은 세계적으로 유명한 과학자 85명과 협력하고, 43편의 연구에서 얻은 데이터를 종합하고, 1만 쌍 이상의 연인들에게서 수백 가지 변수를 발굴하고, 최첨단 머신러닝 모델을 활용해서 사람들이 애인을 더 잘 고르도록 해줄 수 있었을까?

 

아니었다.

 

조엘이 화상 인터뷰에서 나에게 말한 바에 따르면 그 데이터에서 얻은 제1의 교훈이자 가장 놀라운 교훈은 "관계란 예측 불가능하다"는 것이었다. 조엘 연구진은 연인관계인 두 사람의 배경, 취향, 가치관은 두 사람이 행복한 연애를 할 가능성에 별다른 영향을 주지 않는다는 놀라운 사실을 발견했다.

 

p.48

누가 좋은 연애 상대일지를 데이터로 예측하기는 어렵다. 반면 누가 연애 상대로 인기가 많을지는 데이터로 쉽게 예측할 수 있다. 그러니까 대다수 사람은 데이트를 잘못하고 있다.

댓글