728x90
.groupby
-
파이썬 Pandas DataFrame .groupby<Python>/[DataFrame] 2023. 3. 8. 15:48
Pandas에서는 그룹 단위로 데이터를 처리할 수 있습니다. 이번에는 그룹 단위로 데이터를 정렬하고, 누적 비율을 계산하는 방법과 그룹 단위로 특정 분위수의 위치를 구하는 방법에 대해 알아보겠습니다. (1) 그룹별로 x 칼럼을 정렬 후 누적 비율을 구하기 그룹 단위로 데이터를 정렬하고 누적 비율을 계산하기 위해서는 groupby 메서드와 cumsum 메서드를 사용할 수 있습니다. 먼저 다음과 같은 DataFrame이 있다고 가정해봅시다. group x 0 A 1 1 A 2 2 A 3 3 B 4 4 B 5 5 B 6 여기서 group 칼럼을 기준으로 그룹을 지정한 후 x 칼럼을 정렬하고 누적 비율을 계산해보겠습니다. df.groupby('group')['x'].apply(lambda x: x.sort_va..