<Python>/[Sklearn]

sklearn.impute.IterativeImputer 파라미터 정리

9566 2021. 12. 28. 16:07
728x90

IterativeImputer(회귀대치)

class sklearn.impute.IterativeImputer(estimator=None, *, missing_values=nan, 
sample_posterior=False, max_iter=10, tol=0.001, n_nearest_features=None,
 initial_strategy='mean', imputation_order='ascending', skip_complete=False, 
min_value=- inf, max_value=inf, verbose=0, random_state=None, add_indicator=False)

 

from sklearn.experimental import enable_iterative_imputer
from sklearn.impute import IterativeImputer 

# train = 아무 데이터프레임 가능 (대신 모든변수가 float, int 형태)
df = train.copy()
df = IterativeImputer(random_state=2021).fit_transform(df)
df = pd.DataFrame(df)
df.columns = train.columns
df

IterativeImputer 파라미터

estimator = estimator object, default=BayesianRidge()

missing_values = int or np.nan, default=np.nan

sample_posterior = bool, default=False

max_iter = int, default=10

tol = float, default=1e-3

n_nearest_features = int, default=None
#  결측값을 추정하는 데 사용할 다른 특성의 수
#
절대 상관 계수를 사용하여 측정
# 기능의 수가 많을 때 상당한 속도 향상을 제공
# None인 경우 모든 기능이 사용

initial_strategy = {‘mean’, ‘median’, ‘most_frequent’, ‘constant’}, default=’mean’

 

imputation_order = {‘ascending’, ‘descending’, ‘roman’, ‘arabic’, ‘random’}, default=’ascending’

# 기능이 전가되는 순서입니다. 가능한 값:

  • 'ascending': 결측값이 가장 적은 특성에서 가장 많은 특성까지.
  • 'descending': 결측값이 가장 많은 특성에서 가장 적은 특성까지.
  • 'roman': 좌에서 ​​우로.
  • 'arabic': 오른쪽에서 왼쪽으로.
  • 'random': 각 라운드에 대한 무작위 순서입니다.

 

skip_complete = bool, default=False

# 학습(fit)때 값이 있었고 테스트(transform) 때 값이 없을때, True면 fit값 그대로/ False면 계산한 값

min_value = {float, array-like of shape (n_features,)}, default=-np.inf

max_value = {float, array-like of shape (n_features,)}, default=np.inf

# 둘의 디폴트 값 => (-∞, ∞)

 

verbose = int, default=0

random_state = {int, RandomState instance, None}, default=None

add_indicator = bool, default=False

 

728x90