728x90
데이터 중복
1. 중복값 확인
df[df.duplicated(keep=False)]
2. 중복값 제거
df = df.drop_duplicates()
실습 코드
import pandas as pd
import numpy as np
df = pd.DataFrame({ 'X1': [0, 1, 2, 4, 0, 1, 4, 4],
'X2': [5, 7, np.nan, 9, 0, 1, 4, 4],
'X3': [np.nan, 10, np.nan, 12, 0, 1, 4, 4]})
# 1. 중복값 확인
df[df.duplicated(keep=False)]
# 2. 중복값 제거
df = df.drop_duplicates()
실습 결과

실습 파일
728x90
'<Python> > [DataFrame]' 카테고리의 다른 글
| 파이썬 Pandas DataFrame 변수명 변경 (0) | 2021.12.19 |
|---|---|
| 파이썬 Pandas DataFrame 함수 제작 (0) | 2021.12.19 |
| 파이썬 Pandas DataFrame 상관계수 (0) | 2021.12.19 |
| 파이썬 Pandas DataFrame 데이터 분류 (1) | 2021.12.19 |
| 파이썬 Pandas DataFrame 데이터 그룹화 (0) | 2021.12.19 |