-
파이썬 Pandas Seires<Python>/[Series] 2021. 12. 3. 16:37728x90
한 열 + 인덱스 = array([1, 2, 3, 4]) + 인덱스
4x1 형태 가장 바깥 []의 안의 가장 바깥 ,을 엔터(axis)라 생각
array([1, 2, 3, 4]) = 4x1 형태 # array([1,2,3,4], [5,6,7,8]) = 2x4 형태
데이터프레임의 부분
시리즈와 숫자 비교연산가능 ex) df_missing > 0
적용가능한 함수
- 조건—————————————————————————————————————-
- s=s[조건] #범위줄이기
- s[조건].plot.bar() #그래프 그리기
- 개수세기———————————————————————————————————-
- len(s) # 길이확인, 개수세기
- s.count() # 널값포함 개수세기
- .sort_values(ascending=False) #정렬
- type(Series)
- .unique() # 내용물중 유니크만# 결과는 ndarray형태
- .to_dict() #딕셔너리로
- .index
- .index.tolist()
- .value_counts() #각 데이터를 세어서 내림차순으로 정리하는 함수
- .values.reshape(-1, 1) # 1차원을 2차원으로 → MinMaxScaler() 때 필수
- 연산———————————————————————————————
- df['x1'].mean() # max, min, std, median
- df['x1'][:10] # 0~9까지의 데이터행 추출
728x90