728x90
DataFrame의 결측값 채우기
-
파이썬 Pandas DataFrame 결측치 회귀모형 추정값으로 채우기<Python>/[DataFrame] 2023. 3. 8. 16:21
데이터 분석에서 결측값은 분석에 방해가 되는 요소입니다. 결측값을 제외하고 분석을 진행하게 되면 데이터 분석의 정확도를 높일 수 있습니다. 하지만 결측값을 제외하면 데이터의 수가 줄어들게 되어 분석의 정확도가 낮아질 수 있습니다. 이러한 문제를 해결하기 위해서 결측값을 선형회귀모형으로 대체할 수 있습니다. (1) 결측값을 제외한 데이터로부터 선형회귀모형 훈련하기 선형회귀모형은 독립변수와 종속변수 사이의 선형적인 관계를 나타내는 모델입니다. 이 모델을 통해 결측값을 대체할 수 있습니다. 선형회귀모형을 훈련하기 위해서는 다음과 같은 과정이 필요합니다. 데이터 불러오기 결측값 제거하기 종속변수와 독립변수 선택하기 선형회귀모형 만들기 모델 훈련하기 (2) 선형회귀모형으로 부터 추정값 계산하기 선형회귀모형을 통해..