본문 바로가기

mlops4

기술보다는 문제에 - 머신러닝 엔지니어링 인 액션 머신러닝 붐이 일었을 때와 달리 점점 더 시간이 가면 갈수록 머신러닝 기법에 대한 강조보다는 어떻게 프로젝트를 구성하는지, 실무에서 어떤 점들을 고려해야 하는지, 재무적인 관점을 어떻게 어필해야 하는지와 같이 조금 더 실무와 가까운 내용의 책들이 나오고 있다. 이 책도 그런 책 중 하나다. 챕터 4까지 코드 한 줄 안나온다. 계속해서 문제 정의와 스코프 설정에 대한 내용을 강조한다. 저자는 처음부터 현자였던 걸까? 그렇게 포장할 수도 있겠지만, 저자는 포장하지 않고 자신의 아픈 상처를 드러낸다. 66쪽을 보면 이런 구절이 나온다. 흥미로운 최신 알고리듬을 사용하고 싶은 열정이 프로젝트에서 형편없이 발휘된 사례를 여러 번 목격했습니다. 대표적인 예는 이미지 해상도 업스케일링을 위한 GAN 프로젝트로, 12.. 2023. 12. 5.
머신러닝 파워드 애플리케이션 https://link.coupang.com/a/bcHhWd 머신러닝 파워드 애플리케이션:아이디어에서부터완성된제품까지강력한머신러닝애플리케이션 COUPANG www.coupang.com p.43~44 모델 한 문장에서 다른 문장으로 매핑하는 모델은 앞서 언급한 생성 모델에 속합니다. 이런 모델은 최근 몇 년간 급격히 발전했습니다. 시퀀스-투-시퀀스(sequence-to-sequence) 모델은 번역 작업을 위해 2014년 개발되어 기계 번역과 사람 번역 사이의 간격을 좁혔습니다. 하지만 이런 모델의 성공은 대부분 문장 수준의 작업에 기반했고, 한 문단보다 긴 텍스트를 처리하는 데 자주 사용되지 않았습니다. 지금까지 한 문단을 다른 언어로 옮길 때, 긴 범위에 걸친 문맥을 감지할 수 없었기 때문입니다. 또한.. 2023. 10. 16.
MLOps 도입 가이드 p.23 머신러닝 모델 생애주기를 규모있게 관리하기 어려운 세 가지 주요 이유는 다음과 같다. - 많은 의존성 : 데이터는 지속적으로 변화하고, 비즈니스 요구사항도 변경된다. 모델의 결과를 지속적으로 비즈니스에 반영하여, 상용 배포한 모델과 실제 데이터가 요구사항에 부합하도록 하면서 동시에 원래의 문제를 해결하거나 원래의 목표를 달성하도록 해야 한다. - 동일한 언어를 사용하지 않는 이해관계자들 : 머신러닝 모델 생애주기에는 사업 담당자, 데이터 과학자, IT 개발/운영 팀이 모두 관련되어 있지만, 대부분의 경우 상호 소통의 기준이 될 수 있는 동일한 도구 사용이나 기반 기술 공유가 이루어지지 않는다. - 소프트웨어 개발을 모르는 데이터 과학자 : 대부분의 데이터 과학자는 모델 구축 혹은 평가에 특화된 .. 2022. 6. 17.
머신러닝 시스템 디자인 패턴 p.8 머신러닝의 진정한 가치는 추론 결과에 있다. 추론 결과가 애플리케이션의 사용자나 비즈니스 프로세스에 대해 효과를 발휘해야만 도움이 되는 머신러닝이라 말할 수 있을 것이다. 학습 시 아무리 높은 정확도를 낼 수 있는 머신러닝 모델이라 할지라도 실전에서 사용되지 않으면 의미가 없기 때문이다. 머신러닝의 연구 분야에서는 학습한 모델의 평가 결과나 학습을 더욱 빠르게 하는 방법, 이전에 없던 새로운 것들을 생성하는 콘텐츠 등이 주로 이목을 끌지만, 프로덕트로서 사용자에게 가치를 제공하기 위해서는 머신러닝을 프로덕트에 포함해 제공할 필요가 있다. p.9 Google은 프로덕트 개발 과정에서 인간과 AI의 연관성에 관한 프랙티스를 정리한 가이드북인 'PAIR (People + AI Research)'를 공개.. 2022. 5. 10.