-
728x90
# 4/12
fit()/transform() vs fit_transform()
train셋에만 fit_transform() 가능, test셋에 쓰면 train셋으로 학습한걸 지워버리고 test셋만 학습해버리기 때문에 안됨
StandardScaler.fit() : 평균 𝜇과 표준편차 𝜎를 계산
StandardScaler.transform() : 정규화/표준화, Standardization, z = (𝑥-𝜇)/𝜎
RobustScaler : 평균과 분산 대신에 중간 값과 사분위 값을 사용합니다.
Normalizer : 특성 벡터의 유클리디안 길이가 1이되도록 조정합니다.
# KFold
model = lgb.LGBMClassifier(n_estimators=10000, objective = 'binary',
best_iteration = model.best_iteration_
feature_importance_values += model.feature_importances_ / k_fold.n_splits
test_predictions += model.predict_proba(test_features, num_iteration = best_iteration)[:, 1] / k_fold.n_splits
valid_score = model.best_score_['valid']['auc']
train_score = model.best_score_['train']['auc']728x90