본문 바로가기

CS/MachineLearning61

케글 메달리스트가 알려주는 캐글 노하우 https://link.coupang.com/a/bcwWoT 캐글 메달리스트가 알려주는 캐글 노하우 COUPANG www.coupang.com 여러 명의 저자가 공동 집필하고 각자 파트별로 집필한 만큼, 중복되는 내용도 가끔씩 나온다. 밑줄긋기 p.34 Code Competition은 Simple Competition가 비교했을 때 몇 가지 장점이 있습니다. 첫째, 점수 계산에 사용될 테스트 셋을 참가자에게 공개하지 않고 컴페티션을 진행할 수 있습니다. 정답 파일을 만들기 위해서는 테스트 셋에 대한 예측이 필요하기 때문에 일반적으로는 정답을 제이한 테스트 셋을 참가자들에게 공개합니다. 다만, 이 과정에서 테스트 셋의 정보를 모델 생성에 활용하거나 테스트 셋의 분포를 미리 파악해 테스트 셋에 적합한 솔루션.. 2023. 10. 14.
진짜챗GPT API 활용법 p.261 ChatGPT API의 GPT-3.5-turbo 모델은 입력으로 사용하는 텍스트와 ChatGPT API가 반환하는 답변의 길이를 모두 포함하여 최대 4,096 토큰을 처리할 수 있습니다. 예를 들어 ChatGPT API 입력으로 약 3,000토큰 정도의 길이를 가진 입력을 사용하면 ChatGPT는 최대 약 1,000토큰의 답변을 할 수 있는 구조입니다. 입력의 길이가 4,096의 길이에 인접한 입력을 사용하면 ChatGPT API가 답변을 하던 도중 4,096개의 토큰을 모두 소진하면 더 이상 답변을 생성할 수 없어 텍스트가 중간에 끊길 수 있습니다. 또한 입력의 길이가 4,096을 넘으면 ChatGPT의 입력으로 사용할 수 없다는 에러가 발생합니다. 이런 현상 때문에 너무 긴 문서들은 한 번.. 2023. 9. 18.
인공지능 소프트웨어 품질 보증을 위한 테스트 기법 p. 2023. 8. 30.
좋은 교과서 - 데이터과학자를 위한 실전 머신러닝 이 서평은 출판사의 지원을 받아 작성하였습니다. 결론부터 말하겠다. 좋은 책이다. 이유는 뭐냐? 어려워서다. 어려워서 좋은 책이라니 무슨 말인가. 비유하자면 이런거다. 맵지만 맛없는 음식이 있고 매운데 맛있는 음식이 있다. 이 책은 매운데 맛있는 그런 음식과 같다. 맵지만 맛없는 음식의 대표적인 예는 번역을 이상하게 하는 경우다. 쉬운 책이든 어려운 책이든 번역을 이상하게 하면 가독성이 안좋아지고 어려워진다. 이 책은 그와 반대로 국내 저자가 썼기 때문에 그런 번역 문제에서 자유롭다. 그리고 다루는 주제를 보면 일반적으로 머신러닝 서적에서 자주 다루는 내용을 다루고 있다. (당연한 이야기이긴 하다. 모든 분야가 그렇겠지만 일반적으로 머신러닝 서적에서 자주 다루는 내용을 실무에서 사용하지, 그렇지 않은 내.. 2023. 8. 23.
101가지 문제로 배우는 딥러닝 허깅페이스 트랜스포머 with 파이토치 2023. 8. 22.
OpenAI 다국어 음성인식 시스템 Whisper https://velog.io/@juheesvt/%EC%98%A4%ED%94%88AI%EA%B0%80-%EA%B3%B5%EA%B0%9C%ED%95%9C-%EB%8B%A4%EA%B5%AD%EC%96%B4-%EC%9D%8C%EC%84%B1-%EC%9D%B8%EC%8B%9D-%EC%8B%9C%EC%8A%A4%ED%85%9C-whisper 오픈AI가 공개한 다국어 음성 인식 시스템 whisper 모델 아키텍쳐는 encoder-decdoer 변환기로 구현되는 간단한 end-to-end 접근 방식 velog.io https://youtu.be/RTpeETDoJpc 2023. 7. 11.