본문 바로가기

CS/MachineLearning61

현장에서 바로 써먹는 데이터 분석 p.128 선형보간법(Linear Interpolation)은 끝점의 값이 주어졌을 때 그 사이에 위치한 값을 추정하기 위해 직선 거리에 따라 선형적으로 계산하는 방법입니다. p.169 만약 부화장 A와 B의 병아리 몸무게 평균이 38g으로 동일하더라도 표준편차가 크면 병아리를 사육하는 데 문제가 있을 수 있습니다. 몸무게 분포가 좁은 집단은 동일한 사료를 먹고 키우더라도 성장하는 데 큰 무리가 없지만 몸무게 분포가 넓은 집단은 왜소한 병아리가 상대적으로 거대한 병아리한테 먹이를 빼앗겨 잘 먹지 못하고 있을 수 있기 때문입니다. 즉, 평균의 함정에 빠지는 문제를 보완하기 위해 데이터의 분포를 알아야 하고, 그 분포를 설명해주는 지표가 바로 표준편차입니다. p.171 지금 설명하는 병아리의 몸무게 분포 외.. 2023. 1. 1.
DeepChecks - Test ML Model https://deepchecks.com/ Testing Machine Learning Models | Deepchecks Continuous validation for machine learning. Validate and monitor your data and models during training, production and new version releases. deepchecks.com 2022. 12. 24.
머신러닝 자동화 시스템 구축 p.3 두 가지 이유로 머신러닝 자동화를 배워야 합니다. 첫째, 상용화된 머신러닝 자동화 시스템은 범용적인 목적으로 개발됐기 때문입니다. 즉, 어느 데이터에도 잘 맞도록 설계됐습니다. 이렇나 시스템은 한 기업이 보유한 데이터에 특화돼 있지 않아 만족스러운 성능을 내지 못하거나 꼭 필요한 기능 등이 포함돼 있지 않을 수 있습니다. 물론 앞서 설명한 대로 개인화된 솔루션을 구매할 수도 있으나 적지 않은 비용이 발생합니다. 둘째, 머신러닝 자동화를 배우는 과정에서 실전적인 머신러닝 모델 개발 과정을 익힐 수 있기 때문입니다. 즉, 효과적인 머신러닝 자동화 시스템을 구축하려면 다양한 머신러닝 모델이 수학적으로 어떻게 작동하고 학습되는지보다 데이터가 주어졌을 때 어떠한 탐색과 전처리가 필요한지, 어느 종류의 모델.. 2022. 12. 7.
How I Would Learn Data Science in 2022 https://www.youtube.com/watch?v=Rt6eb9VOFII 1. Topics/Learning Framework "Meta-Learning" (how to learn) Breadth-first approach centered around project-based learning 2. Resources mentioned in the video Link to freeCodeCamp: https://www.freecodecamp.org/ Link to Dataiku's ML guides: https://knowledge.dataiku.com/latest/... Link to Josh Starmer's Statquest: https://www.youtube.com/c/joshstarmer Li.. 2022. 9. 17.
[딥러닝 프로젝트 01] Kaggle Breast Ultrasound Image Classification https://www.youtube.com/watch?v=eOFtmogYKek 2022. 9. 15.
Online Shoppers Purchasing Intention Using Explainable AI(XAI) https://www.youtube.com/watch?v=C_GmaYzJ5g8 1. What is Explainable AI? 2. Method - LIME 3. Method - SHAP 4. Finding 2022. 9. 13.