목록R (9)
IT Log

RStudio는 R을 보다 생산적으로 사용할 수 있도록 설계된 통합 도구 모음입니다. RStudio와 RStudio Server로 나뉘며, RStudio는 Windows / Mac / Linux 에 제공되며, RStudio Server는 Debian / Ubuntu, Red Hat / CentOS 및 SUSE Linux 에 제공됩니다. RStudio와 RStudio Server의 차이는 웹 브라우저를 통한 액세스 여부로 사용되는 목적과 OS에 있어서 약간의 차이가 있습니다. 일반적으로는 RStudio를 사용하시면 되겠습니다. 이 글은 Windows에서 RStudio를 설치하는 과정입니다. 혹시 OS가 다르더라도 아래 Download 페이지에서 자신에게 맞는 OS 설치 프로그램을 Download하여 진행하..

1. R Download R CRAN 홈페이지에 가서 R을 Download 합니다. https://cran.r-project.org/bin/windows/base/ 2. R Install 2-1. Download한 파일을 실행합니다. 설치 언어를 선택한 뒤 확인 2-2. LICENSE에 대한 정보와 R을 설치할 위치를 선택합니다. 둘 다 다음을 선택합니다. (설치할 위치를 변경하실 분은 '찾아보기'를 클릭한 뒤 설치할 위치를 선택하고 다음을 선택합니다.) 2-3. 본인 사양에 맞게 불필요한 부분은 제외한 뒤 다음을 선택합니다. 왼쪽 그림과 같이 체크박스를 풀거나 오른쪽 그림과 같이 목록에 해당하는 목록을 선택합니다. 2-4. 스타트업 옵션은 Yes를 선택하면 단계가 늘어나니 기본값인 No를 선택합니다. ..

T-검정이란? 두 집단간의 평균의 차이가 통계적으로 유의한지를 파악할 때 필요한 통계적 기법 귀무가설과 대립가설 설정 예를 들어, 남자의 평균 수명은 60세이다. 라는 가설을 검정한다면 귀무가설은 남자의 평균 수명이 60세이고, 대립가설은 남자의 평균 수명이 60세가 아니다. 이다. 그리고 좀 더 자세히 대립가설을 나누자면 첫번째로 방금말한 남자의 평균수명 ≠ 60, 두번째로 남자의 평균 수명 60 이다. 이런 대립가설의 첫번째를 양측검정이라하고, 두번째와 세번째를 단측검정이라고 합니다. 가설 기호 동의 유무 검정의 형태 귀무가설 = O 대립가설 ≠ X 양측 검정 X 단측검정(upper) 유의 확률(p-value) p-value는 귀무가설이 맞다고 가정할 때 얻..

Continuous data install.packages("qcc") library(qcc) data(pistonrings) # 지정된 데이터세트를 load해준다 attach(pistonrings) # R검색경로에 첨부되어, DB오브젝트에 이름을 지정하여 액세스 가능하게 해준다 diameter = qcc.groups(diameter, sample) # qcc함수로 데이터를 쉽게 그룹화 해준다 qcc(diameter[1:25,], type = "xbar") qcc(diameter[1:25,], type = "xbar", newdata = diameter[26:40,]) q = qcc(diameter[1:25,], type = "xbar", newdata = diameter[26:40,],plot=FALS..

상관분석이란? 두 변수간에 어떤 선형적 관계를 갖고 있는 지를 분석하는 방법. 두 변수는 서로 독립적이거나 상관된 관계일 수 있고, 그 정도를 상관관계라 한다. 정도를 파악하는 상관계수는 두 변수간의 연관된 정도를 나타낼 뿐 인과관계를 설명하지 않는다. 피어슨 상관 계수 값이 ±1에 가까울수록 강한 관계 값이 0에 가까울수록 의미없는 관계 +면 같은방향, -면 반대방향으로 동일한 관계 스피어만 상관 계수 자료의 값 대신 순위를 이용하는 경우의 상관계수 자료에 이상점이 있거나 표본크기가 작을 때 유용하다. -1과 1사이의 값을 가지고, 순위가 완전히 일치하면 +1, 완전히 반대이면 -1이다. 1. 산점도 직교 좌표계를 이용해 두 개 변수 간의 관계를 나타내는 방법 x=1:10 y=x^2 plot(x,y) ..

단일 비율 binom.test 성공 확률에 대한 간단한 귀무 가설 테스트 binom.test(x, n, p=0.5, alternative = c("two.sided", "less", "greater"), conf.level = 0.95) x 성공횟수 n 시행횟수 p 가정한 확률 alternative 대체 가설 conf.level 반환된 신뢰구간에 대한 신뢰수준 binom.test(67,120) 두 비율의 차이 prop.test 여러그룹의 비율이 같거나 특정값이 같은지 비교하는 test prop.test(x, n, p=NULL, alternative = c("two.sided", "less", "greater"), conf.level = 0.95, correct = TRUE) x 성공횟수 n 시행횟수 p ..

dplyr mutate select filter summarise arrange 결측치 is.na na.omit na.rm 결측치 대체하기 이상치 제거하기 dplyr 함수 기능 filter() 행 추출 select() 열 추출 arrange() 정렬 mutate() 변수 추가 summarise() 통계치 산출 group_by() 집단별로 나누기 left_join 데이터 합치기(열) bind_rows() 데이터 합치기(행) filter starwars%>% filter(species=="Droid") filter는 조건과 일치하는 행을 추출합니다. species열에서 Droid인 행만 추출합니다. select starwars%>% select(name, ends_with("color")) select는 조..

이항분포란? 연속된 n번의 독립적 시행에서 각 시행이 확률 p를 가질 때의 이산 확률 분포이다. 베르누이 시행이라고도 불린다.( n=1일 때 ) 밀도함수 dbinom(x, size, prob, log = FALSE) x = seq(0,100) plot(x,dbinom(x,100,0.5),type="l") 누적분포함수 pbinom(q, size, prob, lower.tail = TRUE, log.p = FALSE) plot(x,pbinom(x,100,0.5),type="l") 분위수함수 qbinom(p, size, prob, lower.tail = TRUE, log.p = FALSE) x = seq(0,1,by=0.01) plot(x,qbinom(x,100,0.5),type="l") 난수함수 rbinom..