<R>
-
요인 분석 in r<R>/[데이터 분석] 2021. 12. 4. 19:40
요인분석 1. 역문항 처리 data1 % select_all 2. 요인회전 및 요인적재값 library(GPArotation) data_EFA 0.05이면 통계적으로 유의한 평균의 차이가 없다 # -> 등분산성을 만족->anova) lawstat :: levene.test(data1$Y, data2$X1, location="mean", correction.method="zero.correction") data2_aov 0.05이면 등분산성 만족 t.test(Y~X2, var.equal=T, data=data2) 6. 요인에 대한 상관분석,상관도표 6-1. 요인 계산 data2 % mutate(X1 = rowMeans(data2, na.rm=T)) %>% select_all 6-2. 상관분석 #(proba..
-
-
-
[데이터 전처리] - 상관분석 in r<R>/[데이터 전처리] 2021. 12. 4. 19:39
상관분석 1. 피어슨 상관분석 방법 1 cor(Y, X1) #양/음의 상관관계를 가진다. cor.test(Y, X1) #p-value < 0.05이면 두 변수간 상관관계가 유의하다. cor(data[,-k]) # 상관계수행렬 시각화 plot(data[,-k]) #상관행렬 그래프 corrplot :: corrplot(cor(data[,-k])) #히트맵 corrgram :: corrgram(data[,-k], upper.panel = panel.conf) #히트맵 + 상관계수값
-
[데이터 전처리] - 시각화 in r<R>/[데이터 전처리] 2021. 12. 4. 19:38
데이터 시각화 1. 독립변수(X)별 종속변수(Y) 시각화 방법 1 data_list % which() lst % rename(aa % geom_point(alpha=.2, color = "#008ABC" + labs(title = paste0(df_list, "vs Y"), + x = df_list, y = "", color = df_list) + theme_bw() + theme(legend.positive = "bottom")}) grid.arrange(grobs = lst, ncol = 2) 방법 2 # 종속변수를 잘 설명하는 독립변수 선택(회귀분석, 예측분석) pairs(data %>% sample_n(min(1000, nrow(data))), lower.panel=function(x,y){poi..
-
-