<Python>/[DataFrame]

파이썬 Pandas DataFrame 정보(사분위수, 최대 최소값 등 수치형 정보)

9566 2021. 12. 19. 15:54
728x90

 

정보

1. 결측값을 제외한 데이터 개수 확인
.info() 
# output : 변수명/null 존재여부/dtype

2. 사분위수 
.describe()
# output : count, mean, std, min, max, 25%, 50%, 75% 수치형 정보

3. 사분위수 활용
df['x1'].describe()['75%']

4. 널값 정보
.isnull().sum()

5. 널값 정보
.isna().sum()

6. 데이터 타입
.dtypes 

7. 변수명 
.columns() #결과는 인덱스형태

 

예제 코드

import pandas as pd 
import numpy as np

df = pd.DataFrame({ 'X1': [0, 1, 2, 4], 
                           'X2': [5, 7, np.nan, 9], 
                           'X3': [np.nan, 10, np.nan, 12]}) 

 

# 1. 결측값을 제외한 데이터 개수 확인
.info() 
# output : 변수명/null 존재여부/dtype

# 2. 사분위수 
.describe() 
# output : count, mean, std, min, max, 25%, 50%, 75% 수치형 정보

# 3. 사분위수 활용
df['x1'].describe()['75%']

# 4. 널값 정보
.isnull().sum()

# 5. 널값 정보
.isna().sum()

# 6. 데이터 타입
.dtypes 

# 7. 변수명 
.columns() #결과는 인덱스형태

 

실행 결과

 

 

 

첨부 파일

정보(사분위수, 최대 최소값 등 수치형 정보) by 9566.ipynb
0.01MB

 

 

 

 

 

728x90