-
파이썬 Pandas DataFrame 데이터 유형별 칼럼 선택, 배제<Python>/[DataFrame] 2023. 3. 7. 19:11728x90
Pandas는 데이터 분석을 위한 파이썬 라이브러리로, 데이터 프레임을 다루기 위한 다양한 함수를 제공합니다. 이 중에서도 데이터 프레임의 칼럼별 데이터 유형을 확인하고, 특정 데이터 유형의 칼럼을 선택하거나 제외하는 방법은 매우 유용합니다.
1. 데이터 프레임의 칼럼별 데이터 유형 확인하기
데이터 프레임의 칼럼별 데이터 유형을 확인하기 위해서는 dtypes 속성을 이용하면 됩니다. 이 속성은 각 칼럼의 데이터 유형을 Series 형태로 반환합니다.
import pandas as pd df = pd.DataFrame({'A': [1, 2, 3], 'B': ['a', 'b', 'c'], 'C': [1.0, 2.0, 3.0]}) print(df.dtypes)
위 코드를 실행하면 다음과 같이 출력됩니다.
A int64 B object C float64 dtype: object
각 칼럼의 데이터 유형은 해당 칼럼의 이름과 함께 출력됩니다. int64는 정수형, object는 문자열, float64는 실수형을 의미합니다.
728x902. 특정 데이터 유형의 칼럼 선택하기
특정 데이터 유형의 칼럼을 선택하기 위해서는 select_dtypes 함수를 이용하면 됩니다. 이 함수는 데이터 프레임에서 특정 데이터 유형을 갖는 칼럼들만 선택하여 새로운 데이터 프레임을 반환합니다.
import pandas as pd df = pd.DataFrame({ 'col1': [1, 2, 3], 'col2': ['a', 'b', 'c'], 'col3': [1.1, 2.2, 3.3], }) df_selected = df.select_dtypes(include=['int64', 'float64']) print(df_selected)
위 코드를 실행하면 다음과 같이 출력됩니다.
col1 col3 0 1 1.1 1 2 2.2 2 3 3.3
3. pandas DataFrame 에서 특정 데이터 유형의 칼럼을 제외하기
select_dtypes(exclude=[]) 메서드를 사용하여 특정 데이터 유형의 칼럼을 제외할 수 있습니다. 이때 exclude 인자에 제외하고자 하는 데이터 유형을 리스트 형태로 넣어주면 해당 데이터 유형의 칼럼이 제외됩니다.
import pandas as pd df = pd.DataFrame({ 'col1': [1, 2, 3], 'col2': ['a', 'b', 'c'], 'col3': [1.1, 2.2, 3.3], }) df_excluded = df.select_dtypes(exclude=['object']) print(df_excluded)
위 코드를 실행하면 다음과 같이 출력됩니다.
col1 col3 0 1 1.1 1 2 2.2 2 3 3.3
728x90'<Python> > [DataFrame]' 카테고리의 다른 글
파이썬 Pandas DataFrame .filter() regex 옵션 (0) 2023.03.07 파이썬 Pandas DataFrame .filter() items 옵션 (0) 2023.03.07 파이썬 Pandas DataFrame 저장(to_string) (0) 2023.02.21 파이썬 Pandas DataFrame 저장(to_html) (0) 2023.02.21 파이썬 Pandas DataFrame 저장(to_pickle) (0) 2023.02.21