'dataframe' 태그의 글 목록

728x90

dataframe 13

파이썬 Pandas DataFrame 저장(to_string)

DataFrame.to_string(buf=None, columns=None, col_space=None, header=True, index=True, na_rep='NaN', formatters=None, float_format=None, sparsify=None, index_names=True, justify=None, max_rows=None, max_cols=None, show_dimensions=False, decimal='.', line_width=None, min_rows=None, max_colwidth=None, encoding=None) Pandas DataFrame의 to_string() 메서드는 DataFrame 객체를 문자열로 반환합니다. 이 문자열은 데이터 프레임의 내용을 표시하..

<Python>/[DataFrame] 2023.02.21

파이썬 Pandas DataFrame 저장(to_clipboard)

DataFrame.to_clipboard(excel=True, sep=None, kwargs) Pandas DataFrame은 to_clipboard() 메서드를 이용하여 클립보드에 데이터를 저장할 수 있습니다. 이는 별도의 파일을 생성하지 않고 데이터를 바로 복사해서 붙여넣을 수 있어 매우 편리합니다. to_clipboard() 메서드는 다음과 같은 인자를 가질 수 있습니다. excel: bool, optional True일 경우, 복사한 데이터를 엑셀 파일 형태로 저장할 수 있습니다. sep: str, optional 복사할 데이터의 구분자(separator)를 지정합니다. 기본값은 "\t"으로 탭을 구분자로 사용합니다. index: bool, optional True일 경우, DataFrame의 인..

<Python>/[DataFrame] 2023.02.21

파이썬 Pandas DataFrame 저장(to_csv)

DataFrame.to_csv(path_or_buf=None, sep=',', na_rep='', float_format=None, columns=None, header=True, index=True, index_label=None, mode='w', encoding=None, compression='infer', quoting=None, quotechar='"', line_terminator=None, chunksize=None, date_format=None, doublequote=True, escapechar=None, decimal='.', errors='strict', storage_options=None) Pandas는 파이썬 데이터 분석 라이브러리로, 데이터를 다루는 데 유용한 기능을 제공합..

<Python>/[DataFrame] 2023.02.21

파이썬 Pandas DataFrame 함수 제작

함수 제작 1. 사용자 제작 함수 .apply(사용자 제작 함수) # 사용자가 만든 함수를 적용할수있다. ex)np.sum, np.square 2. 사용자 제작 함수 df.mean(axis=1) # 한행의 모든 값의 평균 3. 사용자 제작 함수 .aggregate([min, np.median, max]) 4.사용자 제작 함수 .aggregate({'X1' : min, 'X2' : sum}) 실습 코드 import pandas as pd import numpy as np df = pd.DataFrame({ 'X1': [0, 1, 2, 4, 0, 1, 2, 4], 'X2': [5, 7, np.nan, 9, 0, 1, 2, 4], 'X3': [np.nan, 10, np.nan, 12, 0, 1, 2, 4]})..

<Python>/[DataFrame] 2021.12.19

파이썬 Pandas DataFrame 중복값

데이터 중복 1. 중복값 확인 df[df.duplicated(keep=False)] 2. 중복값 제거 df = df.drop_duplicates() 실습 코드 import pandas as pd import numpy as np df = pd.DataFrame({ 'X1': [0, 1, 2, 4, 0, 1, 4, 4], 'X2': [5, 7, np.nan, 9, 0, 1, 4, 4], 'X3': [np.nan, 10, np.nan, 12, 0, 1, 4, 4]}) # 1. 중복값 확인 df[df.duplicated(keep=False)] # 2. 중복값 제거 df = df.drop_duplicates() 실습 결과 실습 파일

<Python>/[DataFrame] 2021.12.19

파이썬 Pandas DataFrame 상관계수

상관계수 1. 상관계수 #dataframe df.corr() 2. X1에 대한 상관계수 내림차순 정렬 df.corr()['X1'].sort_values(ascending=False) 실습 코드 import pandas as pd import numpy as np df = pd.DataFrame({ 'X1': [0, 1, 2, 4, 0, 1, 2, 4], 'X2': [5, 7, np.nan, 9, 0, 1, 2, 4], 'X3': [np.nan, 10, np.nan, 12, 0, 1, 2, 4]}) # 1. 상관계수 #dataframe df.corr() # 2. X1에 대한 상관계수 내림차순 정렬 df.corr()['X1'].sort_values(ascending=False) 실습 결과 실습 파일

<Python>/[DataFrame] 2021.12.19

파이썬 Pandas DataFrame 데이터 분류

데이터 분류 1. X1을 기준으로 정렬하기 .sort_values('X1') 2. X1을 기준으로 정렬 후 X1 보기 .sort_values(by=['X1'])['X1'] # Series형태 3. X1 기준으로 정렬 후 내림차순 상위 10개 보기 .sort_values(by='X1', ascending=False).head(10) # 상위 10개 실습 코드 import pandas as pd import numpy as np df = pd.DataFrame({ 'X1': [0, 1, 2, 4, 0, 1, 2, 4], 'X2': [5, 7, np.nan, 9, 0, 1, 2, 4], 'X3': [np.nan, 10, np.nan, 12, 0, 1, 2, 4]}) # 1. X1을 기준으로 정렬하기 .sort..

<Python>/[DataFrame] 2021.12.19

파이썬 Pandas DataFrame 데이터 그룹화

데이터 그룹화 1. X1의 각 원소마다의 X2값 평균 .groupby('X1').mean()['X2'] 2. X1의 각 원소마다의 X2값 평균 .groupby('X1')['X2'].agg(**{'mean_X2' : 'mean'}) 3. X1의 각 원소마다의 X2값 평균 .groupby('X1').agg(**{'mean_X2' : pd.NamedAgg(column='X2', aggfunc='mean')}) 4. latitude의 각 원소마다의 longitude, total_rooms값 평균 df.groupby('latitude').agg(**{'mean_longitude': pd.NamedAgg(column = 'longitude', aggfunc = 'mean') , 'mean_total_rooms' :..

<Python>/[DataFrame] 2021.12.19

파이썬 Pandas DataFrame 데이터 변환

데이터 변환 1. DataFrame -> Series df['x1'] df.x1 2. DataFrame -> DataFrame df[['x1']] 3. 열 추출 #DataFrame df[['x1', 'x2']] 4. X1, X3 열 추출 #DataFrame df.iloc[:, [0,2]] 5. Series → ndarray (행,) 형태 np.array(df['X1']).reshape(-1,1) 6. Series → Ndarray df['x1'].unique() 7. Series → Dictionary df['x1'].to_dict() 8. Series → List sorted(list(set(df['x1']))) 9. 시간으로 변환 .to_datetime(df['x1'], format='%Y-%m-%d..

<Python>/[DataFrame] 2021.12.19

파이썬 Pandas DataFrame 개수

개수 세기 1. 길이확인, 개수 세기 len(df) len(df['x1']) #시리즈 2. (행, 열) 개수 df.shape 3. 행개수 df.shape[0] 4. 열개수 df.shape[1] 5. (행,) 개수 df['x1'].shape 6. 널값을 제외한 개수 세기 df.count() df['x1'].count() #시리즈 실습 코드 import pandas as pd import numpy as np df = pd.DataFrame({ 'X1': [0, 1, 2, 4], 'X2': [5, 7, np.nan, 9], 'X3': [np.nan, 10, np.nan, 12]}) # 1. 길이확인, 개수 세기 len(df) len(df['X1']) #시리즈 # 2. (행, 열) 개수 df.shape # 3..

<Python>/[DataFrame] 2021.12.19

1 2

더보기

9566

ML/DL, GPT 활용, 빅데이터 분석기사, 정보처리기사, SQLD, ADsP, ADP 자료 및 개념 공유 데이터 분석, SQL 개념 설명

250x250

dataframe, 데이터프레임, 파이썬, SQL 프로그래머스, Oracle, 빅분기, R, 파라미터, 9566, String, date, 데이콘, select, 빅데이터 분석기사, 빅분기 실기, 프로그래머스, MySQL, SQL 프로그래머스 SELECT, sql, 실기,

Today :
Yesterday :

728x90

티스토리툴바