정보
1. 결측값을 제외한 데이터 개수 확인
.info() # output : 변수명/null 존재여부/dtype
2. 사분위수
.describe() # output : count, mean, std, min, max, 25%, 50%, 75% 수치형 정보
3. 사분위수 활용
df['x1'].describe()['75%']
4. 널값 정보
.isnull().sum()
5. 널값 정보
.isna().sum()
6. 데이터 타입
.dtypes
7. 변수명
.columns() #결과는 인덱스형태
예제 코드
import pandas as pd
import numpy as np
df = pd.DataFrame({ 'X1': [0, 1, 2, 4],
'X2': [5, 7, np.nan, 9],
'X3': [np.nan, 10, np.nan, 12]})
# 1. 결측값을 제외한 데이터 개수 확인
.info() # output : 변수명/null 존재여부/dtype
# 2. 사분위수
.describe() # output : count, mean, std, min, max, 25%, 50%, 75% 수치형 정보
# 3. 사분위수 활용
df['x1'].describe()['75%']
# 4. 널값 정보
.isnull().sum()
# 5. 널값 정보
.isna().sum()
# 6. 데이터 타입
.dtypes
# 7. 변수명
.columns() #결과는 인덱스형태
실행 결과


첨부 파일
'<Python> > [DataFrame]' 카테고리의 다른 글
| 파이썬 Pandas DataFrame 데이터 그룹화 (0) | 2021.12.19 |
|---|---|
| 파이썬 Pandas DataFrame 데이터 변환 (0) | 2021.12.19 |
| 파이썬 Pandas DataFrame 개수 (0) | 2021.12.19 |
| 파이썬 Pandas DataFrame 열 제거 (0) | 2021.12.18 |
| 파이썬 Pandas DataFrame 일부 행 제거 (0) | 2021.12.18 |