728x90

dataframe 13

파이썬 Pandas DataFrame 저장(to_string)

DataFrame.to_string(buf=None, columns=None, col_space=None, header=True, index=True, na_rep='NaN', formatters=None, float_format=None, sparsify=None, index_names=True, justify=None, max_rows=None, max_cols=None, show_dimensions=False, decimal='.', line_width=None, min_rows=None, max_colwidth=None, encoding=None) Pandas DataFrame의 to_string() 메서드는 DataFrame 객체를 문자열로 반환합니다. 이 문자열은 데이터 프레임의 내용을 표시하..

파이썬 Pandas DataFrame 저장(to_clipboard)

DataFrame.to_clipboard(excel=True, sep=None, kwargs) Pandas DataFrame은 to_clipboard() 메서드를 이용하여 클립보드에 데이터를 저장할 수 있습니다. 이는 별도의 파일을 생성하지 않고 데이터를 바로 복사해서 붙여넣을 수 있어 매우 편리합니다. to_clipboard() 메서드는 다음과 같은 인자를 가질 수 있습니다. excel: bool, optional True일 경우, 복사한 데이터를 엑셀 파일 형태로 저장할 수 있습니다. sep: str, optional 복사할 데이터의 구분자(separator)를 지정합니다. 기본값은 "\t"으로 탭을 구분자로 사용합니다. index: bool, optional True일 경우, DataFrame의 인..

파이썬 Pandas DataFrame 저장(to_csv)

DataFrame.to_csv(path_or_buf=None, sep=',', na_rep='', float_format=None, columns=None, header=True, index=True, index_label=None, mode='w', encoding=None, compression='infer', quoting=None, quotechar='"', line_terminator=None, chunksize=None, date_format=None, doublequote=True, escapechar=None, decimal='.', errors='strict', storage_options=None) Pandas는 파이썬 데이터 분석 라이브러리로, 데이터를 다루는 데 유용한 기능을 제공합..

파이썬 Pandas DataFrame 함수 제작

함수 제작 1. 사용자 제작 함수 .apply(사용자 제작 함수) # 사용자가 만든 함수를 적용할수있다. ex)np.sum, np.square 2. 사용자 제작 함수 df.mean(axis=1) # 한행의 모든 값의 평균 3. 사용자 제작 함수 .aggregate([min, np.median, max]) 4.사용자 제작 함수 .aggregate({'X1' : min, 'X2' : sum}) 실습 코드 import pandas as pd import numpy as np df = pd.DataFrame({ 'X1': [0, 1, 2, 4, 0, 1, 2, 4], 'X2': [5, 7, np.nan, 9, 0, 1, 2, 4], 'X3': [np.nan, 10, np.nan, 12, 0, 1, 2, 4]})..

파이썬 Pandas DataFrame 상관계수

상관계수 1. 상관계수 #dataframe df.corr() 2. X1에 대한 상관계수 내림차순 정렬 df.corr()['X1'].sort_values(ascending=False) 실습 코드 import pandas as pd import numpy as np df = pd.DataFrame({ 'X1': [0, 1, 2, 4, 0, 1, 2, 4], 'X2': [5, 7, np.nan, 9, 0, 1, 2, 4], 'X3': [np.nan, 10, np.nan, 12, 0, 1, 2, 4]}) # 1. 상관계수 #dataframe df.corr() # 2. X1에 대한 상관계수 내림차순 정렬 df.corr()['X1'].sort_values(ascending=False) 실습 결과 실습 파일

파이썬 Pandas DataFrame 데이터 분류

데이터 분류 1. X1을 기준으로 정렬하기 .sort_values('X1') 2. X1을 기준으로 정렬 후 X1 보기 .sort_values(by=['X1'])['X1'] # Series형태 3. X1 기준으로 정렬 후 내림차순 상위 10개 보기 .sort_values(by='X1', ascending=False).head(10) # 상위 10개 실습 코드 import pandas as pd import numpy as np df = pd.DataFrame({ 'X1': [0, 1, 2, 4, 0, 1, 2, 4], 'X2': [5, 7, np.nan, 9, 0, 1, 2, 4], 'X3': [np.nan, 10, np.nan, 12, 0, 1, 2, 4]}) # 1. X1을 기준으로 정렬하기 .sort..

파이썬 Pandas DataFrame 데이터 그룹화

데이터 그룹화 1. X1의 각 원소마다의 X2값 평균 .groupby('X1').mean()['X2'] 2. X1의 각 원소마다의 X2값 평균 .groupby('X1')['X2'].agg(**{'mean_X2' : 'mean'}) 3. X1의 각 원소마다의 X2값 평균 .groupby('X1').agg(**{'mean_X2' : pd.NamedAgg(column='X2', aggfunc='mean')}) 4. latitude의 각 원소마다의 longitude, total_rooms값 평균 df.groupby('latitude').agg(**{'mean_longitude': pd.NamedAgg(column = 'longitude', aggfunc = 'mean') , 'mean_total_rooms' :..

파이썬 Pandas DataFrame 데이터 변환

데이터 변환 1. DataFrame -> Series df['x1'] df.x1 2. DataFrame -> DataFrame df[['x1']] 3. 열 추출 #DataFrame df[['x1', 'x2']] 4. X1, X3 열 추출 #DataFrame df.iloc[:, [0,2]] 5. Series → ndarray (행,) 형태 np.array(df['X1']).reshape(-1,1) 6. Series → Ndarray df['x1'].unique() 7. Series → Dictionary df['x1'].to_dict() 8. Series → List sorted(list(set(df['x1']))) 9. 시간으로 변환 .to_datetime(df['x1'], format='%Y-%m-%d..

파이썬 Pandas DataFrame 개수

개수 세기 1. 길이확인, 개수 세기 len(df) len(df['x1']) #시리즈 2. (행, 열) 개수 df.shape 3. 행개수 df.shape[0] 4. 열개수 df.shape[1] 5. (행,) 개수 df['x1'].shape 6. 널값을 제외한 개수 세기 df.count() df['x1'].count() #시리즈 실습 코드 import pandas as pd import numpy as np df = pd.DataFrame({ 'X1': [0, 1, 2, 4], 'X2': [5, 7, np.nan, 9], 'X3': [np.nan, 10, np.nan, 12]}) # 1. 길이확인, 개수 세기 len(df) len(df['X1']) #시리즈 # 2. (행, 열) 개수 df.shape # 3..

728x90