본문 바로가기
CS/Python&R

선 실습 후 공부 - 배워서 바로 써먹는 데이터 분석

by Diligejy 2022. 7. 2.

프로그래밍에 관심이 많아지는 시기다. 동시에 두려움도 커지는 시기다.

요새는 그러지 않는데 과거에 데이터 분석 교육업체들은 데이터 분석가의 수요가 엄청나다며 광고를 엄청 돌렸고 사람들은 그 광고를 받아들였다. 하지만 현실에서 분석가를 얼마나 찾는지 실제로 찾아보라. 정말 수요가 별로 없다는 걸 알게 될 것이다. 

 

'직업'으로서 데이터 분석은 그렇다는 얘기다. 하지만 어떤 포지션의 업무를 진행하든 사무직의 경우 분석이 들어가지 않는 경우는 드물다. 자료를 조사해야하고, 그 속에서 자신이 원하는 데이터를 보고 결론을 도출해야 한다. 보통 이런 과정을 직접 손으로 구글링하고 엑셀에 복사 붙여넣기 하는 과정을 거치곤 하지만, 파이썬을 이용해서 간단하게 해볼 수 있다.

 

이 책에 나온 내용은 이미 입문자 단계에서 거의 알파벳처럼 거의 무조건 가르치는 내용이다. 하지만 그렇다고 해도 직접 해보냐 해보지 않냐의 차이는 크다. 그리고 이 책은 출간된지 얼마 안되었기 때문에 몇 년 지난책들이나 블로그 등에서 시간이 흐르면서 실습 대상 사이트의 구조가 달라지거나 하는 등으로 크롤링 코드가 작동 안할 염려가 적다.

 

나도 입문할 때 그랬지만, 입문자 단계에서 디버깅은 정말 어렵다. 사실 돈을 벌기 위해 일하면서 강제(?!)로 습득하면 익숙해지지만, 취미로 하는 경우에는 그렇지 않기 때문에 학습 자료와 현실 세계가 다를 경우 포기하기 쉽다.  

 

이 책을 굳이 순서대로 볼 필요는 없다. 그냥 맘에 드는 부분을 골라잡고 해당 부분을 실습하기 위해 필요하면 앞 부분을 찾아보는 것도 좋은 방법이다. 물론 앞에서부터 보는게 좋다면 그렇게 하는 것도 좋다.

댓글