'<R>' 카테고리의 글 목록 (2 Page)

요인 분석 in r

<R>/[데이터 분석] 2021. 12. 4. 19:40

요인분석 1. 역문항 처리 data1 % select_all 2. 요인회전 및 요인적재값 library(GPArotation) data_EFA 0.05이면 통계적으로 유의한 평균의 차이가 없다 # -> 등분산성을 만족->anova) lawstat :: levene.test(data1$Y, data2$X1, location="mean", correction.method="zero.correction") data2_aov 0.05이면 등분산성 만족 t.test(Y~X2, var.equal=T, data=data2) 6. 요인에 대한 상관분석,상관도표 6-1. 요인 계산 data2 % mutate(X1 = rowMeans(data2, na.rm=T)) %>% select_all 6-2. 상관분석 #(proba..

회귀분석 in r

<R>/[데이터 분석] 2021. 12. 4. 19:40

회귀분석 1. 회귀분석 lm.model

[데이터 전처리] - 데이터 분할 in r

<R>/[데이터 전처리] 2021. 12. 4. 19:40

데이터 분할 1. train/test 데이터 나누기 방법 1 idx

[데이터 전처리] - 상관분석 in r

<R>/[데이터 전처리] 2021. 12. 4. 19:39

상관분석 1. 피어슨 상관분석 방법 1 cor(Y, X1) #양/음의 상관관계를 가진다. cor.test(Y, X1) #p-value < 0.05이면 두 변수간 상관관계가 유의하다. cor(data[,-k]) # 상관계수행렬 시각화 plot(data[,-k]) #상관행렬 그래프 corrplot :: corrplot(cor(data[,-k])) #히트맵 corrgram :: corrgram(data[,-k], upper.panel = panel.conf) #히트맵 + 상관계수값

[데이터 전처리] - 더미화 in r

<R>/[데이터 전처리] 2021. 12. 4. 19:39

더미화 1. 변수 수치화 후 더미화 방법 1 data1 % mutate(X1 = as.numeric(X1), X2 = as.numeric(X2)) dummy

[데이터 전처리] - 시각화 in r

<R>/[데이터 전처리] 2021. 12. 4. 19:38

데이터 시각화 1. 독립변수(X)별 종속변수(Y) 시각화 방법 1 data_list % which() lst % rename(aa % geom_point(alpha=.2, color = "#008ABC" + labs(title = paste0(df_list, "vs Y"), + x = df_list, y = "", color = df_list) + theme_bw() + theme(legend.positive = "bottom")}) grid.arrange(grobs = lst, ncol = 2) 방법 2 # 종속변수를 잘 설명하는 독립변수 선택(회귀분석, 예측분석) pairs(data %>% sample_n(min(1000, nrow(data))), lower.panel=function(x,y){poi..

[데이터 전처리] - 변수 생성 in r

<R>/[데이터 전처리] 2021. 12. 4. 19:38

변수 생성 1. 변수 생성, 재범주화 방법 1 data

[데이터 전처리] - 변수 삭제 in r

<R>/[데이터 전처리] 2021. 12. 4. 19:38

변수 삭제 1. 필요없는 변수(열) 삭제 방법 1 data

ABOUT ME

9566

티스토리툴바