IT Log
상관분석 본문
728x90
반응형
상관분석이란?
- 두 변수간에 어떤 선형적 관계를 갖고 있는 지를 분석하는 방법.
- 두 변수는 서로 독립적이거나 상관된 관계일 수 있고, 그 정도를 상관관계라 한다.
- 정도를 파악하는 상관계수는 두 변수간의 연관된 정도를 나타낼 뿐 인과관계를 설명하지 않는다.
피어슨 상관 계수
- 값이 ±1에 가까울수록 강한 관계
- 값이 0에 가까울수록 의미없는 관계
- +면 같은방향, -면 반대방향으로 동일한 관계
스피어만 상관 계수
- 자료의 값 대신 순위를 이용하는 경우의 상관계수
- 자료에 이상점이 있거나 표본크기가 작을 때 유용하다.
- -1과 1사이의 값을 가지고, 순위가 완전히 일치하면 +1, 완전히 반대이면 -1이다.
1. 산점도
- 직교 좌표계를 이용해 두 개 변수 간의 관계를 나타내는 방법
x=1:10
y=x^2
plot(x,y)
cor(x,y)
cor(x,sqrt(y))
cor(x,y,method="spearman")
2. 공분산
- 2개의 확률변수의 상관정도를 나타내는 값
- 상관분석을 통해 정도를 파악하기에는 부적절
cov(attitude)
3. 상관계수 검정
cor(attitude)
with(attitude, cor.test(rating, complaints))
상호관계가 0이 아닌 0.8254176으로 rating과 complaints는 같은방향으로 강한 관계이다.
728x90
반응형
'R' 카테고리의 다른 글
T-검정( T-test ) (0) | 2019.06.19 |
---|---|
SPC - Control Chart (0) | 2019.05.10 |
비율검정 (0) | 2019.04.30 |
R 데이터 전처리 (0) | 2019.04.30 |
이항분포 (0) | 2019.04.29 |
Comments