목록Statistics/분석(analysis) (2)
IT Log
1. 주성분 분석 고차원의 데이터를 저차원의 데이터로 한원시키는 기법입니다. 서로 연관 가능성이 있는 고차원 공간의 표본들을 선형 연관성이 없는 저차원 공간(주성분)의 표본으로 변환하기 위해 직교 변환을 사용한다. 주성분의 차원수는 원래 표본의 차원수보다 작거나 같다. 주성분 분석은 데이터를 한개의 축으로 사상시켰을 때 그 분산이 가장 커지는 축을 첫 번째 주성분, 두 번째로 커지는 축을 두 번째 주성분으로 놓이도록 새로운 좌표계로 데이터를 선형 변환한다. 이와 같이 표본의 차이를 가장 잘 나타내는 성분들로 분해함으로써 여러가지 응용이 가능하다. 이 변환은 첫째 주성분이 가장 큰 분산을 가지고, 이후의 주성분들은 이전의 주성분들과 직교한다는 제약 아래에 가장 큰 분산을 갖고 있다는 식으로 정의되어있다. ..
선형 회귀란? 종속 변수 y와 한 개 이상의 독립 변수 x와의 선형 상관 관계를 모델링하는 회귀분석 기법. 독립 변수 : 입력 값이나 원인 종속 변수 : 결과물이나 효과 하나의 독립 변수(설명 변수)에 기반한 경우에는 단순 선형 회귀이며, 둘 이상의 독립 변수(설명 변수)에 기반한 경우에는 다중 선형 회귀라고 합니다. 선형 예측 함수를 사용해 회귀식을 모델링하며, 알려지지 않은 파라미터는 데이터로부터 추정하며, 이렇게 만들어진 회귀식을 선형 모델이라고 합니다. 선형회귀의 용도는 크게 2가지로 분류됩니다. 첫 번째는 값을 예측하는 것이 목적인 경우로 선형 회귀를 사용해 데이터에 적합한 예측 모형을 개발하고 개발한 선형 회귀식을 사용해 y가 없는 x값에 대해 y를 예측하기 위해 사용합니다. 두 번째는 종속 ..