본문 바로가기
CS/MachineLearning

파이썬 기반 금융 인공지능

by Diligejy 2023. 3. 8.

 

1. 고쳐야 할 부분

 

책에서 고쳐야할 부분이 많은거 같다.

그림과 설명이 매치가 되지 않는 부분이 많다. 내용 자체는 정확한데 약간 답안지 밀리듯 하나씩 밀려서 미스매치가 되었다.

 

예를 들어 44페이지를 보면 

 

다음은 무작위 샘플 데이터를 생성하고 다양한 개수의 기저 함수를 사용하여 최소자승 회귀분석을 실시하는 코드다. [그림 1-7]에 결과를 시각화하였다. 예제에서 보듯이 가장 많은 개수의 기저 함수를 사용해도 추정 결과가 그다지 좋지 않다. 당연히 평균제곱오차값도 높다.

 

라고 되어있다. 그런데 그림 1-7을 보면

?? 딱 봐도 MSE가 낮아보이고, 실제로 코드 돌려봤을 때 낮다. Keras신경망으로 했기 때문이다.

 

반대로 그림 1-6을 보면 

 

넘파이 기반의 선형회귀로 작업을 했기 때문에 차수를 높여도 MSE가 그림 1-7에 나온 것 대비해서 높다. 

다른 부분에서도 코드와 그림이 매칭이 안되는 경우가 많다.

 

예전에 고등학교때 답안지 밀려썼던 기억이 나는데, 이거 개정해서 출간해주시면 더 좋을거 같다.

 

 

 

 

 

밑줄긋기

p.32~33

KMeans와 같은 알고리즘은 한 번 학습된 후에는 새로운 특징 데이터에 대해서도 클러스터 예측을 할 수 있다. 이런 알고리즘으로 은행의 잠재적 채무자와 실제 채무자를 학습했다고 가정하자. 아마도 잠재적 채무자의 신뢰도에 대해 학습한 후 두 개의 클러스터를 생성할 것이다. 학습한 다음에는 이 모델을 새로운 잠재적 채무자가 생겼을 때 '신뢰할 수 있는 채무자'와 '신뢰할 수 없는 채무자'로 구별하는 데 사용된다.

 

p.42

두 방법 사이에는 강조할 만한 근본적인 차이가 있다.

 

최소자승 회귀분석 방법은 선형회귀 결과에서 보듯이 잘 정의된 특정한 파라미터값을 한 번에 계산하지만 신경망 방법은 점진적인 학습 방법을 이용한다. 즉, 신경망 내부의 가중치라는 일련의 파라미터값이 처음에는 무작위로 초기화되었다가 신경망 출력과 실제 출력값 사이의 차이를 이용해 점진적으로 조정해나간다.

 

댓글