728x90
스케일링에서는 데이터 범위를 변경하는 반면
정규화에서는 데이터 분포의 모양을 변경합니다.
# 스케일링
from mlxtend.preprocessing import minmax_scaling
minmax_scaling(X, columns=['x1'])
보통 0~1사이로 스케일링된다.
# 정규화
from scipy import stats
normalized_data = stats.boxcox(original_data)728x90
'<Kaggle-Course>' 카테고리의 다른 글
| 캐글 data_cleaning/04-character-encoding (0) | 2023.03.16 |
|---|---|
| 캐글 data_cleaning/03-parsing-dates (0) | 2023.03.16 |
| 캐글 data_cleaning/01-handling-missing-values (0) | 2023.03.16 |
| 캐글 advanced_sql/04-writing-efficient-queries (0) | 2023.03.15 |
| 캐글 advanced_sql/02-analytic-functions (0) | 2023.03.15 |