<Python>/[DataFrame]
파이썬 Pandas DataFrame .filter() regex 옵션
9566
2023. 3. 7. 19:28
728x90
pd.DataFrame.filter() 함수
pd.DataFrame.filter() 함수는 데이터프레임의 특정 행이나 열을 선택하여 가져오는 함수입니다. 이 함수를 사용하면 정확하게 필요한 데이터만을 가져올 수 있어 편리합니다. 이 함수는 items, like, regex 옵션을 제공합니다.
regex 옵션
regex 옵션은 정규 표현식을 사용하여 가져올 행이나 열을 선택하는 옵션입니다. 이 옵션은 문자열에서 패턴을 찾아 일치하는 값을 반환합니다.
예를 들어, 다음과 같은 데이터프레임이 있다고 가정해보겠습니다.
import pandas as pd
df = pd.DataFrame({
'A': [1, 2, 3],
'B': [4, 5, 6],
'CDE': [7, 8, 9],
'FG': [10, 11, 12]
})
이 데이터프레임에서 filter() 함수를 사용하여 CDE라는 이름의 칼럼만 선택하려면 다음과 같이 작성할 수 있습니다.
728x90
df.filter(regex='CDE')
위 코드를 실행하면 다음과 같은 결과를 얻을 수 있습니다.
CDE FG
0 7 10
1 8 11
2 9 12
위 코드에서 ^(C|F)는 정규 표현식으로 C 또는 F로 시작하는 칼럼을 선택합니다.
마무리
이처럼 pd.DataFrame.filter() 함수의 regex 옵션을 사용하여 정규 표현식을 이용해 데이터프레임에서 필요한 행이나 열만을 선택할 수 있습니다. 이를 이용해 데이터 처리를 보다 더 효율적으로 할 수 있습니다.
728x90