본문 바로가기

CS156

대규모 머신러닝 시스템 디자인 패턴 이 서평은 출판사의 후원을 받아 작성하였습니다. 어떤 분야가 되었건 마찬가지겠지만, 머신러닝도 똑같이 실무에 가면 이런저런 문제에 부닥친다. 특히 단순히 머신러닝의 수학적 모델링에 관한 문제뿐 아니라, 서버나 다른 인프라 같은 문제들이 실무를 해야 하는 사람들에게 풀기 어려운 과제가 되곤 한다.  풀기 어렵다는 말은 단순히 문제가 기술적인 측면에서 어렵다는 의미는 아니다.물론 기술적으로 어렵다. 분산처리 시스템인데 당연히 어려울 수밖에 없다.  하지만, 실무를 해야하는 곳이 분산처리 시스템을 운용해야할 만큼 규모가 큰 데이터를 다루는 곳이라면, 각 팀마다 R&R이 다를 것이고, 인프라를 다루는 팀이나 DBA나 각각 분리되어있고, PM 조직도 따로 있을 것이기 때문에 이들과의 소통 및 협업을 통해 원하는 .. 2024. 12. 23.
밑바닥부터 시작하는 비트코인 p.35 타원곡선 암호는 전자 서명과 이의 검증에 사용되는데 이는 트랜잭션(transaction) 작동 방법의 핵심 알고리즘입니다. 트랜잭션은 비트코인에서 더 이상 쪼갤 수 없는 가치 이동의 단위입니다. 2024. 2. 24.
개발자를 위한 최소한의 실무 지식 p.24 트랜잭션(transaction)은 컴퓨터로 처리하는 작업의 단위를 말합니다. 트랜잭션에 속한 모든 작업이 성공적으로 완료되어야 트랜잭션의 실행도 완료되기 때문에 트랜잭션은 '작업과 운명을 함께한다'라고 표현할 수 있습니다. p.25 트랜잭션에는 커밋(commit)과 롤백(rollback)이라는 명령어를 사용합니다. 커밋은 '약속하다'라는 뜻으로 여러 개의 쿼리를 묶어 하나의 트랜잭션으로 처리하겠다고 약속하는 명령어입니다. 그리고 롤백은 쿼리 실행 도중 오류가 발생하면 상태를 되돌리기 위해 사용하는 명령어입니다. 컴퓨터의 모든 작업이 메모리에서 실행되지만, 작업한 결과는 반드시 디스크에 기록되어야 합니다. 메모리가 가진 휘발성이라는 특징 때문인데요. 전원 연결이 끊어지면 메모리의 데이터가 연기처럼.. 2024. 2. 9.
실무 프로젝트로 배우는 데이터 분석 with R p.3 분석 업무중 생기는 문제 1. 다른 직무로 일하다가 최근 분석 직무에 배정받은 경우 -> 아이디어는 있지만 어떻게 설계 및 구현을 해야 할지 모르는 상황 2. 분석 지식만 갖춘 신입의 경우 a. 이것도 되지 않을까? -> 이게 의미가 있나? b. 그러면 이렇게는 되지 않을까? -> 이것도 의미가 없겠다 c. 그러면 이렇게 하자 -> 데이터가 확보 안됐네? d. 그럼 이렇게 하지 -> 결과가 별로네. p.5 경영지원팀 'A'는 상사로부터 이번에 출시한 'P 상품'의 매출 분석을 해오라는 지시를 받았다. 'A'는 평소 하던것처럼 엑셀을 활용해 매출 데이터에 대한 피벗 테이블을 작성하고, 그래프를 그린 후, 상사에게 제출했다. 하지만 상사는 'A'에게 '이 정도는 그냥 현황파악이지 누가 할 줄 모르나?.. 2024. 2. 9.
밑바닥부터 시작하는 딥러닝 4 p.29 일반적인 강화 학습 문제에서 환경에는 상태 정보가 있습니다. 에이전트가 어떤 행동을 하면 환경의 상태가 바뀌고, 에이전트는 새로운 상태를 관찰하여 적절한 행동을 취합니다. 다만 밴디트 문제에서는 플레이어가 이용하는 슬롯머신들의 확률 설정에 변화가 없습니다. 즉, 환경의 상태가 변하지 않으므로 따로 고려할 필요가 없습니다. p.30 여기서 기억할 것은 슬롯머신 플레이 같은 확률적 사건은 '기댓값'으로 평가할 수 있다는 사실입니다. 다르게 말하면 무작위성에 현혹되지 않기 위해 '기댓값'을 기준으로 삼아야 합니다. 밴디트 문제에서는 보상의 기댓값을 가치(value)라는 특별한 이름으로 부르곤 합니다. 특히 '행동의 결과로 얻는 보상의 기댓값'을 행동 가치(action value)라고 합니다. 그래서 .. 2024. 1. 27.
스파크 완벽 가이드 2024. 1. 21.