-
파이썬 Pandas DataFrame .filter() regex 옵션<Python>/[DataFrame] 2023. 3. 7. 19:28728x90
pd.DataFrame.filter() 함수
pd.DataFrame.filter() 함수는 데이터프레임의 특정 행이나 열을 선택하여 가져오는 함수입니다. 이 함수를 사용하면 정확하게 필요한 데이터만을 가져올 수 있어 편리합니다. 이 함수는 items, like, regex 옵션을 제공합니다.
regex 옵션
regex 옵션은 정규 표현식을 사용하여 가져올 행이나 열을 선택하는 옵션입니다. 이 옵션은 문자열에서 패턴을 찾아 일치하는 값을 반환합니다.
예를 들어, 다음과 같은 데이터프레임이 있다고 가정해보겠습니다.
import pandas as pd df = pd.DataFrame({ 'A': [1, 2, 3], 'B': [4, 5, 6], 'CDE': [7, 8, 9], 'FG': [10, 11, 12] })
이 데이터프레임에서 filter() 함수를 사용하여 CDE라는 이름의 칼럼만 선택하려면 다음과 같이 작성할 수 있습니다.
728x90df.filter(regex='CDE')
위 코드를 실행하면 다음과 같은 결과를 얻을 수 있습니다.
CDE FG 0 7 10 1 8 11 2 9 12
위 코드에서 ^(C|F)는 정규 표현식으로 C 또는 F로 시작하는 칼럼을 선택합니다.
마무리
이처럼 pd.DataFrame.filter() 함수의 regex 옵션을 사용하여 정규 표현식을 이용해 데이터프레임에서 필요한 행이나 열만을 선택할 수 있습니다. 이를 이용해 데이터 처리를 보다 더 효율적으로 할 수 있습니다.
728x90'<Python> > [DataFrame]' 카테고리의 다른 글
파이썬 Pandas DataFrame .loc vs .iloc (0) 2023.03.08 파이썬 Pandas DataFrame .filter() like 옵션 (0) 2023.03.07 파이썬 Pandas DataFrame .filter() items 옵션 (0) 2023.03.07 파이썬 Pandas DataFrame 데이터 유형별 칼럼 선택, 배제 (0) 2023.03.07 파이썬 Pandas DataFrame 저장(to_string) (0) 2023.02.21