-
파이썬 Pandas DataFrame .iter<Python>/[DataFrame] 2023. 3. 8. 16:48728x90
DataFrame에서 데이터를 반복(iterate)하며 처리할 때, Pandas는 다음과 같은 방법들을 제공합니다.
- pd.DataFrame.iterrows() : 행에 대해 순환 반복
- DataFrame의 인덱스와 각 행의 데이터를 순환적으로 반환
- 데이터를 수정할 경우, 매우 느릴 수 있음
- 예시 : for index, row in df.iterrows():
- pd.DataFrame.iteritems() : 열에 대해 순환 반복
- DataFrame의 칼럼 이름과 각 열의 데이터를 순환적으로 반환
- 대용량 데이터에 유용함
- 예시 : for col_name, series in df.iteritems():
- pd.DataFrame.itertuples() : 이름이 있는 튜플 (인덱스, 행, 열) 에 대해 순환 반복
- DataFrame의 각 행을 나타내는 이름 있는 튜플 반환
- 순환 반복을 처리하는 것이 기본적인 반복 방법보다 더 빠름
- 예시 : for row_tuple in df.itertuples(index=False):
728x90이러한 메소드를 사용하여 DataFrame의 데이터를 처리하는 것은 데이터 크기가 큰 경우에도 매우 효과적입니다. 하지만 iterrows()를 사용하여 데이터를 수정하면 매우 느려지므로, 데이터 수정이 필요한 경우에는 다른 메소드를 사용하는 것이 좋습니다. 또한, 데이터 처리 속도를 높이기 위해서는 iterrows()보다는 itertuples()을 사용하는 것이 좋습니다.
728x90'<Python> > [DataFrame]' 카테고리의 다른 글
파이썬 Pandas DataFrame .digitze vs .cut (0) 2023.03.08 파이썬 Pandas DataFrame 칼럼별 결측값 대체 (0) 2023.03.08 파이썬 Pandas DataFrame .sample (0) 2023.03.08 파이썬 Pandas DataFrame 칼럼 다루기 (0) 2023.03.08 파이썬 Pandas DataFrame 결측치 회귀모형 추정값으로 채우기 (0) 2023.03.08 - pd.DataFrame.iterrows() : 행에 대해 순환 반복