본문 바로가기

CS/MachineLearning61

Survival Analysis in Python | Lifelines | Churn rate prediction https://www.youtube.com/watch?v=Vcph8wUsFzg&ab_channel=IlarionGarbuzov 2022. 6. 21.
쿠브플로우 p.76~77 오픈소스로 ML 워크플로우를 구성해야 한다면 고려해야 할 것들이 있습니다. - 하나의 플랫폼 안에서 모든 작업이 가능한가? - 설치가 같편한가? 혹은 설치에 대한 트러블 슈팅 정보가 많은가? - 각각 ML 워크플로우 단계를 수행할 수 있는 SDK 혹은 라이브러리가 있는가? - 해당 SDK에 대한 러닝 커브가 어떤가? - 해당 오픈 소스의 사용자 커뮤니티 활성도가 어떤가? - 오픈소스의 버전이 프로덕션 레벨로 사용할 정도로 성숙한가? - 오픈소스가 다양한 ML 프레임워크 지원하는가? 혹은 현재 사용하고 있는 ML 프레임워크를 지원하는가? - 리소스 관리/스케쥴링을 지원하는가? - 리소스에 대한 인증/권한 (AuthN, AuthZ) 관리를 제공하는가? - 멀티-테넌시(Multi-Tenancy).. 2022. 6. 21.
MLOps 도입 가이드 p.23 머신러닝 모델 생애주기를 규모있게 관리하기 어려운 세 가지 주요 이유는 다음과 같다. - 많은 의존성 : 데이터는 지속적으로 변화하고, 비즈니스 요구사항도 변경된다. 모델의 결과를 지속적으로 비즈니스에 반영하여, 상용 배포한 모델과 실제 데이터가 요구사항에 부합하도록 하면서 동시에 원래의 문제를 해결하거나 원래의 목표를 달성하도록 해야 한다. - 동일한 언어를 사용하지 않는 이해관계자들 : 머신러닝 모델 생애주기에는 사업 담당자, 데이터 과학자, IT 개발/운영 팀이 모두 관련되어 있지만, 대부분의 경우 상호 소통의 기준이 될 수 있는 동일한 도구 사용이나 기반 기술 공유가 이루어지지 않는다. - 소프트웨어 개발을 모르는 데이터 과학자 : 대부분의 데이터 과학자는 모델 구축 혹은 평가에 특화된 .. 2022. 6. 17.
토스ㅣSLASH 22 - 물 흐르듯 자연스러운 ML 서비스 만들기 https://www.youtube.com/watch?v=EEsYbiqqcc0&ab_channel=%ED%86%A0%EC%8A%A4 1. 아키텍처 생각하기 전에 기본부터 생각하자 2. 주의 또 주의 a. 오픈소스를 도입할 때는 언제 도입해서 언제까지 사용하고 언제 걷어낼 것인지 도입의 처음부터 계획과 전략이 필요 b. 토스에서는 사내 라이브러리를 통해 한 번 래핑을 함 (프레임워크 의존성 줄이고 오픈소스 도입하는 바람직한 방법 중 하나) c. MLflow가 위치하는 부분을 정확히 모델의 메타 정보 관리와 배포 힌트 정도로 한정함. - RDB로 대체되어도 거의 영향이 없을 정도의 작은 의존성만 사용 - 사내 라이브러리의 랩핑도 거의 동일한 수준의 메서드로만 구성 -> 새로 합류하는 팀원이 빨리 적응할 수 .. 2022. 6. 10.
싸움구경이 원래 최고의 구경거리 - AI 메이커스 인공지능 전쟁의 최전선 이 서평은 출판사로부터 책을 제공받아 작성하였습니다. 농담삼아 다들 그러지 않나요? 구경중에 제일 재밌는건 싸움구경이라고. 어쩌면 기술만 팔거 같은 ML생태계의 역사는 처절한 싸움의 역사였던거 같습니다. 이 책을 읽다보면 그런 싸움의 역사가 있어서 지금의 딥러닝이 있었음을 알 수 있습니다. 싸우는 것도 점잖게 싸우지 않습니다. 거의 원수를 다루듯 무시하고, 무시당하다가 주도권을 다시 잡으면 학회에서 악마냐고 조롱하고 정말 무슨 중국 무협드라마에 나오는 집안 대대로 원수를 보는 듯 합니다. 그렇지만 단순히 싸우는 얘기만 했다면 이 책이 무슨 가치가 있었을까요. 당연히 그런 다툼과 논쟁의 과정속에서 어떻게 머신러닝 개념이 발달하고 진화했는지 알 수 있죠. 딥러닝 강의를 들어보신분은 아시겠지만, 처음에 그냥 .. 2022. 6. 10.
Building Notebook-based AI Pipelines with Elyra and Kubeflow https://www.youtube.com/watch?v=KR_m20pFXtU&ab_channel=Databricks 1. Interactive Notebooks 2. Elyra Overview a. Elyra is a set of AI Centric extensions to JupyterLab Notebooks. 3. Elyra Key Features a. Visual Pipeline Editor i. Visual editor for building AI pipelines, enabling the conversion of multiple notebooks into batch jobs or workflows. b. Notebooks as batch jobs c. Python script execution.. 2022. 6. 7.