프로그래밍에 관심이 많아지는 시기다. 동시에 두려움도 커지는 시기다.
요새는 그러지 않는데 과거에 데이터 분석 교육업체들은 데이터 분석가의 수요가 엄청나다며 광고를 엄청 돌렸고 사람들은 그 광고를 받아들였다. 하지만 현실에서 분석가를 얼마나 찾는지 실제로 찾아보라. 정말 수요가 별로 없다는 걸 알게 될 것이다.
'직업'으로서 데이터 분석은 그렇다는 얘기다. 하지만 어떤 포지션의 업무를 진행하든 사무직의 경우 분석이 들어가지 않는 경우는 드물다. 자료를 조사해야하고, 그 속에서 자신이 원하는 데이터를 보고 결론을 도출해야 한다. 보통 이런 과정을 직접 손으로 구글링하고 엑셀에 복사 붙여넣기 하는 과정을 거치곤 하지만, 파이썬을 이용해서 간단하게 해볼 수 있다.
이 책에 나온 내용은 이미 입문자 단계에서 거의 알파벳처럼 거의 무조건 가르치는 내용이다. 하지만 그렇다고 해도 직접 해보냐 해보지 않냐의 차이는 크다. 그리고 이 책은 출간된지 얼마 안되었기 때문에 몇 년 지난책들이나 블로그 등에서 시간이 흐르면서 실습 대상 사이트의 구조가 달라지거나 하는 등으로 크롤링 코드가 작동 안할 염려가 적다.
나도 입문할 때 그랬지만, 입문자 단계에서 디버깅은 정말 어렵다. 사실 돈을 벌기 위해 일하면서 강제(?!)로 습득하면 익숙해지지만, 취미로 하는 경우에는 그렇지 않기 때문에 학습 자료와 현실 세계가 다를 경우 포기하기 쉽다.
이 책을 굳이 순서대로 볼 필요는 없다. 그냥 맘에 드는 부분을 골라잡고 해당 부분을 실습하기 위해 필요하면 앞 부분을 찾아보는 것도 좋은 방법이다. 물론 앞에서부터 보는게 좋다면 그렇게 하는 것도 좋다.
'CS > Python&R' 카테고리의 다른 글
대용량 데이터 처리 (0) | 2022.07.23 |
---|---|
프로그래머를 위한 파이썬 (0) | 2022.07.04 |
KOSSDA 데이터페어 : 선거자료의 이해와 활용, '파이썬을 이용한 간단한 여론조사 분석기' (0) | 2022.06.27 |
5 Tips For Object-Oriented Programming Done Well - In Python (0) | 2022.06.04 |
Test-Driven Development In Python // The power of red-green-refactor (0) | 2022.06.01 |
댓글