<Python>/[DataFrame]
파이썬 Pandas DataFrame 중복값
9566
2021. 12. 19. 21:39
728x90
데이터 중복
1. 중복값 확인
df[df.duplicated(keep=False)]
2. 중복값 제거
df = df.drop_duplicates()
실습 코드
import pandas as pd
import numpy as np
df = pd.DataFrame({ 'X1': [0, 1, 2, 4, 0, 1, 4, 4],
'X2': [5, 7, np.nan, 9, 0, 1, 4, 4],
'X3': [np.nan, 10, np.nan, 12, 0, 1, 4, 4]})
# 1. 중복값 확인
df[df.duplicated(keep=False)]
# 2. 중복값 제거
df = df.drop_duplicates()
실습 결과
실습 파일
728x90