R
-
분산분석(ANOVA) in r<R>/[데이터 분석] 2021. 12. 5. 14:26
분산분석(anova) x1의 범주가 y 평균값의 차이가 있는가? ex) 귀무가설 : x1(2개의 범주 : 포워드, 미드필더)에 대해 y(연봉)의 평균은 모두 같다. X별 Y 평균의 차이가 있는지 통계적으로 검증 summary(aov(Y~X1, data)) #1원배치 summary(aov(Y~X1+X2+X1:X2, data)) #2원배치 X1:X2=상호작용효과 # p-value 0.05면 유의한 차이가 있다. X에 따른 Y의 차이가 있는지 통계적으로 검증 var.test(Y~X1, data, alternative = "two.sided") #p-value > 0.05이면 귀무가설을 기각하지 않음 = 등분산 가정을 만족 t.test(Y~X1, data, alternative = "two.sided", var..
-
-
-
-
-
요인 분석 in r<R>/[데이터 분석] 2021. 12. 4. 19:40
요인분석 1. 역문항 처리 data1 % select_all 2. 요인회전 및 요인적재값 library(GPArotation) data_EFA 0.05이면 통계적으로 유의한 평균의 차이가 없다 # -> 등분산성을 만족->anova) lawstat :: levene.test(data1$Y, data2$X1, location="mean", correction.method="zero.correction") data2_aov 0.05이면 등분산성 만족 t.test(Y~X2, var.equal=T, data=data2) 6. 요인에 대한 상관분석,상관도표 6-1. 요인 계산 data2 % mutate(X1 = rowMeans(data2, na.rm=T)) %>% select_all 6-2. 상관분석 #(proba..