목록MATH (1)
이지훈님의 블로그
주성분분석 (Principal Component Analysis)
주성분분석 (PCA) 고차원의 데이터를 저차원의 데이터로 환원시키는 기법이다. 새로운 변수를 원 변수의 선형결합으로 만들어 변수를 축약한다. 장점 : 고차원의 데이터를 큰 정보손실없이 변환해 준다.시각화 편리 -> 변수를 줄임 -> 학습집합의 크기를 줄여줌 -> 학습 시 빠름 한계 : 특징벡터의 Label을 고려하지 않음. 결과값이 특징구분을 좋게한다는 보장은 없음. PCA분석을 이해하기 위해서는 공분산, 고유벡터와 고유값에 대한 개념이 필요하다. 공분산 2개의 확률변수의 상관정도를 나타내는 값이다. cov(x, y) > 0 이면 x가 증가할 때 y도 증가 cov(x, y) < 0 이면 x가 증가할 때 y는 감소 cov(x, y) = 0 이면 상관관계가 없음 다른 차원과의 공분산을 모두 구하고 행렬에 넣..
MATH
2017. 6. 29. 21:19