IT Log

상관분석 본문

R

상관분석

newly0513 2019. 4. 30. 16:40
728x90
반응형

상관분석이란?

  • 두 변수간에 어떤 선형적 관계를 갖고 있는 지를 분석하는 방법.
  • 두 변수는 서로 독립적이거나 상관된 관계일 수 있고, 그 정도를 상관관계라 한다.
  • 정도를 파악하는 상관계수는 두 변수간의 연관된 정도를 나타낼 뿐 인과관계를 설명하지 않는다.

 

피어슨 상관 계수

  • 값이 ±1에 가까울수록 강한 관계
  • 값이 0에 가까울수록 의미없는 관계
  • +면 같은방향, -면 반대방향으로 동일한 관계

스피어만 상관 계수

  • 자료의 값 대신 순위를 이용하는 경우의 상관계수
  • 자료에 이상점이 있거나 표본크기가 작을 때 유용하다.
  • -1과 1사이의 값을 가지고, 순위가 완전히 일치하면 +1, 완전히 반대이면 -1이다.

 

1. 산점도

  • 직교 좌표계를 이용해 두 개 변수 간의 관계를 나타내는 방법
x=1:10
y=x^2
plot(x,y)
cor(x,y)
cor(x,sqrt(y))
cor(x,y,method="spearman")

2. 공분산

  • 2개의 확률변수의 상관정도를 나타내는 값
  • 상관분석을 통해 정도를 파악하기에는 부적절
cov(attitude)

 

3. 상관계수 검정

cor(attitude)

with(attitude, cor.test(rating, complaints))

p-value값이 0.05보다 작으므로 대립가설 채택

상호관계가 0이 아닌 0.8254176으로 rating과 complaints는 같은방향으로 강한 관계이다.
728x90
반응형

'R' 카테고리의 다른 글

T-검정( T-test )  (0) 2019.06.19
SPC - Control Chart  (0) 2019.05.10
비율검정  (0) 2019.04.30
R 데이터 전처리  (0) 2019.04.30
이항분포  (0) 2019.04.29
Comments