본문 바로가기

CS/MachineLearning61

완전 입문자에겐 적합하겠지만 아쉽다 - 하루만에 끝내는 챗GPT 활용법 이 서평은 출판사로부터 책을 제공받아 작성하였습니다. 이 책의 서평은 사실 제목만으로 끝낼 수 있을것 같다. 매우 기초적이고 개론적인 내용 위주로 쓰여져있기 때문에 챗GPT가 무엇인지 아예 잘 모르는 분인 경우에 이 책이 적합할 것 같고 조금이라도 찾아보고 해보신 분이라면 아쉬움을 느낄 것 같다. 거의 매일 신문, 뉴스, 방송, 유튜브 등 모든 매체가 다룬 주제이기 때문에 챗GPT가 무엇인지 기술적으로 정확한 정의는 모르더라도 대충 느낌으로 뭔지 알고 있을 텐데 그런 내용까지 다 서술하고, 그러면서도 챗GPT관련 지식과 각 분야별 활용방안까지 다루려다보니 각각의 내용에 대한 깊이는 얇아졌다. 아예 차라리 블로그/기획안 활용 또는 홈페이지 만들고 튜닝하기와 같이 특정 주제 하나를 잡고 깊게 서술했으면 더 .. 2023. 6. 13.
추천이 아닌 '시스템'에 방점을 둘 것 - 추천 시스템 입문 그동안 데이터 분석 실무를 해오면서 선호하지 않는 업무 중 하나가 추천 시스템이었다. 그냥 느낌적인 느낌으로 추천 시스템이 나와 잘 맞지 않기도 했고, 추천 시스템을 연구하고 개발하면서 성능을 개선한다고 해도, 비즈니스에 도움이 되는지 확신할 수 없었기 때문이다. 일했던 곳의 핵심 솔루션이 아니었던 것도 한 몫 했던 것 같다. 그래서 스터디에 참여하거나 대략적인 내용은 파악했지만, 추천 시스템에 열중하진 않았다. 이 책을 읽으며 이 분들도 나와 같지 않을까? 그런 생각을 했다. 추천 시스템을 연구하고 실무를 하시고 책까지 내신 분들에게 무슨 말이냐 할 수 있겠지만, 이 책의 저자들이 1 ~ 3장을 '추천' 시스템 코드가 아닌 전반적인 추천 '시스템' 에 대해 설명하는 걸 보고 그런 생각을 했다. 추천 시.. 2023. 6. 11.
개발자를 위한 머신러닝 & 딥러닝 이 서평은 출판사로부터 책을 제공받아 작성하였습니다. 무작정 따라하기 좋아하는 타입이라면 이 책을 추천한다. 박해선님의 번역이기도 하거니와(박해선님 번역이라면 사실 품질 보증이 된다는 의미다) 책도 아마존에서 베스트셀러로 이미 검증받은 도서기 때문이다. chatGPT덕에 다시한번 머신러닝의 시대가 부흥하는 거 같고, 딥러닝의 시대가 오는 듯 하지만, 실무에서 실제로 ML을 적용한다는 것 혹은 실제로 ML을 배워본다는 건 쉽지 않은 일이다. 왜냐하면 어렵기 때문이다. ML이 쉽다는 건 내 생각에 거짓말 같다. 하지만 거짓말이 아닌거 같기도 하다. ML을 전문적으로 다루는 프로들의 세계가 아니라면 말이 되기 때문이다. 그렇지만 언제 수학부터 하나하나 다 공부하고 있을까. 그럴 여유가 별로 없다. 그리고 뭔가.. 2023. 4. 28.
BERT와 GPT로 배우는 자연어 처리 p.3 핵심만 알면 길을 잃지 않을 수 있습니다. 2020년 전후 자연어 처리 분야에서 기술 발전을 이끈 방아쇠는 두 개입니다. 하나는 트랜스포머(Transformer), 다른 하나는 전이 학습(transfer learning)이라는 기법입니다. p.18 다음 단어 맞히기로 업스트림 태스크를 수행한 모델을 언어 모델(language model)이라고 합니다. p.19 빈칸 채우기로 업스트림 태스크를 수행한 모델을 마스크 언어 모델(masked language model)이라고 합니다. p.20 사람이 만든 정답 데이터로 모델을 학습하는 방법을 지도 학습이라고 합니다. 이 방식은 데이터를 만드는 데 비용이 많이 들뿐만 아니라 사람이 실수로 잘못된 레이블을 줄 수도 있습니다. 이에 반해 다음 단어 맞히기, .. 2023. 3. 26.
파이썬 기반 금융 인공지능 1. 고쳐야 할 부분 책에서 고쳐야할 부분이 많은거 같다. 그림과 설명이 매치가 되지 않는 부분이 많다. 내용 자체는 정확한데 약간 답안지 밀리듯 하나씩 밀려서 미스매치가 되었다. 예를 들어 44페이지를 보면 다음은 무작위 샘플 데이터를 생성하고 다양한 개수의 기저 함수를 사용하여 최소자승 회귀분석을 실시하는 코드다. [그림 1-7]에 결과를 시각화하였다. 예제에서 보듯이 가장 많은 개수의 기저 함수를 사용해도 추정 결과가 그다지 좋지 않다. 당연히 평균제곱오차값도 높다. 라고 되어있다. 그런데 그림 1-7을 보면 ?? 딱 봐도 MSE가 낮아보이고, 실제로 코드 돌려봤을 때 낮다. Keras신경망으로 했기 때문이다. 반대로 그림 1-6을 보면 넘파이 기반의 선형회귀로 작업을 했기 때문에 차수를 높여도 M.. 2023. 3. 8.
2월 21일 발표 대비 https://www.kaggle.com/code/hellbuoy/carprice-prediction-mlr-rfe-vif CarPrice Prediction MLR+RFE+VIF Explore and run machine learning code with Kaggle Notebooks | Using data from Car Price Prediction Multiple Linear Regression www.kaggle.com 1. TransformerMixin - fit_transform()이나 fit(), transform()을 사용하지 않고 커스터마이즈된 transformer(예를 들어 min-max, normal distribution으로 전환 등) 하고 싶을 때 사용 a. 공식문서 b. 참고링.. 2023. 2. 20.