-
파이썬 Pandas DataFrame 중복값<Python>/[DataFrame] 2021. 12. 19. 21:39728x90
데이터 중복
1. 중복값 확인
df[df.duplicated(keep=False)]2. 중복값 제거
df = df.drop_duplicates()실습 코드
import pandas as pd
import numpy as np
df = pd.DataFrame({ 'X1': [0, 1, 2, 4, 0, 1, 4, 4],
'X2': [5, 7, np.nan, 9, 0, 1, 4, 4],
'X3': [np.nan, 10, np.nan, 12, 0, 1, 4, 4]})# 1. 중복값 확인
df[df.duplicated(keep=False)]# 2. 중복값 제거
df = df.drop_duplicates()실습 결과
실습 파일
728x90'<Python> > [DataFrame]' 카테고리의 다른 글
파이썬 Pandas DataFrame 변수명 변경 (0) 2021.12.19 파이썬 Pandas DataFrame 함수 제작 (0) 2021.12.19 파이썬 Pandas DataFrame 상관계수 (0) 2021.12.19 파이썬 Pandas DataFrame 데이터 분류 (1) 2021.12.19 파이썬 Pandas DataFrame 데이터 그룹화 (0) 2021.12.19