랜덤포레스트

rf.model <- randomForest(data.Y~., data=train, ntree=50, mtry = sqrt(변수개수), importance=T)
rf.model #OOB 에러추정치로 낮을수록 분류모델의 성능이 좋다.
plot(rf.model, 'I') #ntree 개수

names(rf.model)
rf.model$importance
importance(rf.model)
order(importance(rf.model)[,MeanDecreaseAccuracy], decreasing=T) 
#중요변수 순으로 정렬
varImpPlot(rf.model) # 변수중요도 그래프

#caret 패키지
pre <- predict(rf.model, test[,-1], type="class")
confusionMatrix(data=pre, reference=test[,1], positive='1') 
#정분류율(Accuracy), 민감도(Sensitivity), 특이도(Specificity)

#ROCR 패키지
pre.roc <- prediction(as.numeric(pre), as.numeric(test[,1]))
plot(performance(pre.roc, "tpr", "fpr"))
abline(a=0, b=1, lty=2, col="black")

performance(pre.roc, "auc")@y.values[[1]]

728x90

'<R> > [데이터 분석]' 카테고리의 다른 글

분산분석(ANOVA) in r (0)	2021.12.05
앙상블 모형 예측, 성과분석 in r (0)	2021.12.05
연관성 분석 in r (0)	2021.12.05
Support Vector Machine in r (0)	2021.12.05
다중선형회귀분석 in r (0)	2021.12.05

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

인기포스트

ABOUT ME

9566

랜덤포레스트

'<R> > [데이터 분석]' 카테고리의 다른 글

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역

인기포스트

ABOUT ME

랜덤포레스트

'<R> > [데이터 분석]' 카테고리의 다른 글

관련글 관련글 더보기

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역