<Python>/[DataFrame]

파이썬 Pandas DataFrame 중복값

9566 2021. 12. 19. 21:39
728x90

데이터 중복

1. 중복값 확인
df[df.duplicated(keep=False)]

2. 중복값 제거
df = df.drop_duplicates()

 

실습 코드

import pandas as pd 
import numpy as np

df = pd.DataFrame({ 'X1': [0, 1, 2, 4, 0, 1, 4, 4], 
                           'X2': [5, 7, np.nan, 9, 0, 1, 4, 4], 
                           'X3': [np.nan, 10, np.nan, 12, 0, 1, 4, 4]}) 

# 1. 중복값 확인
df[df.duplicated(keep=False)]

# 2. 중복값 제거
df = df.drop_duplicates()

 

실습 결과

 

실습 파일

중복값 by 9566.ipynb
0.00MB

 

 

728x90