-
연관성 분석 in r<R>/[데이터 분석] 2021. 12. 5. 14:25728x90
연관성 분석
- arules 패키지
m <- apriori(data, parameter = list(support = 0.01, confidence = 0.6))) # 최소지지도(support) 이상의 빈발항목집합을 찾고 연관규칙을 계산 # 값이 클수록 유용한 규칙을 나타내는 신뢰도(confidence)와 합쳐, n개의 연관규칙이 생성된다. # 최소지지도와 신뢰도를 높여서 규칙의 개수를 줄일 수 있다.
small <- subset(m, subset = rhs %in% "income=small" & lift > 1.2) length(small) large <- subset(m, subset = rhs %in% "income=large" & lift > 1.2) length(large) inspect(head(sort(small, by = "confidence"), n = 3)) inspect(head(sort(large, by = "confidence"), n = 3)) #n=상위 3개의 연관규칙만 확인 # lift(향상도)는 1이면 좌측항과 우측항의 연관성은 없다. 1보다 크면 유용한 규칙이다. # 좌측항의 결과를 가진 사람의 income은 small이다 # income이 small인 사람은 남자고 미국국적이다. 이런사람에게 저축상품이나 재무상담을 추천해줄수있다.
728x90'<R> > [데이터 분석]' 카테고리의 다른 글
앙상블 모형 예측, 성과분석 in r (0) 2021.12.05 랜덤포레스트 in r (0) 2021.12.05 Support Vector Machine in r (0) 2021.12.05 다중선형회귀분석 in r (0) 2021.12.05 앙상블 모형 제작 in r (0) 2021.12.05