IT Log

주성분 분석 (Principal Component Analysis) 본문

Statistics/분석(analysis)

주성분 분석 (Principal Component Analysis)

newly0513 2020. 8. 25. 09:51
728x90
반응형

1. 주성분 분석

 고차원의 데이터를 저차원의 데이터로 한원시키는 기법입니다. 서로 연관 가능성이 있는 고차원 공간의 표본들을 선형 연관성이 없는 저차원 공간(주성분)의 표본으로 변환하기 위해 직교 변환을 사용한다. 주성분의 차원수는 원래 표본의 차원수보다 작거나 같다. 주성분 분석은 데이터를 한개의 축으로 사상시켰을 때 그 분산이 가장 커지는 축을 첫 번째 주성분, 두 번째로 커지는 축을 두 번째 주성분으로 놓이도록 새로운 좌표계로 데이터를 선형 변환한다. 이와 같이 표본의 차이를 가장 잘 나타내는 성분들로 분해함으로써 여러가지 응용이 가능하다. 이 변환은 첫째 주성분이 가장 큰 분산을 가지고, 이후의 주성분들은 이전의 주성분들과 직교한다는 제약 아래에 가장 큰 분산을 갖고 있다는 식으로 정의되어있다. 중요한 성분들은 공분산 행렬의 고유 벡터이기 때문에 직교하게 된다.

728x90
반응형

'Statistics > 분석(analysis)' 카테고리의 다른 글

선형 회귀(Linear regression)  (0) 2020.07.30
Comments