728x90
중복
-
파이썬 Pandas DataFrame 중복값<Python>/[DataFrame] 2021. 12. 19. 21:39
데이터 중복 1. 중복값 확인 df[df.duplicated(keep=False)] 2. 중복값 제거 df = df.drop_duplicates() 실습 코드 import pandas as pd import numpy as np df = pd.DataFrame({ 'X1': [0, 1, 2, 4, 0, 1, 4, 4], 'X2': [5, 7, np.nan, 9, 0, 1, 4, 4], 'X3': [np.nan, 10, np.nan, 12, 0, 1, 4, 4]}) # 1. 중복값 확인 df[df.duplicated(keep=False)] # 2. 중복값 제거 df = df.drop_duplicates() 실습 결과 실습 파일