<Kaggle-Course>
-
캐글 data_visualization/06-choosing-plot-types-and-custom-styles<Kaggle-Course> 2023. 3. 17. 17:01
트렌드 - 트렌드는 변화의 패턴으로 정의됩니다. sns.lineplot - 꺾은선형 차트는 일정 기간 동안의 추세를 표시하는 데 가장 적합하며 여러 선을 사용하여 둘 이상의 그룹에 대한 추세를 표시할 수 있습니다. 관계 - 데이터의 변수 간의 관계를 이해하는 데 사용할 수 있는 다양한 차트 유형이 있습니다. sns.barplot - 막대 차트는 다른 그룹에 해당하는 수량을 비교하는 데 유용합니다. sns.heatmap - 히트맵을 사용하여 숫자 표에서 색상으로 구분된 패턴을 찾을 수 있습니다. sns.scatterplot - 산점도는 두 연속 변수 사이의 관계를 보여줍니다. 색상으로 구분된 경우 세 번째 범주형 변수와의 관계도 표시할 수 있습니다. sns.regplot - 산점도에 회귀선을 포함하면 ..
-
캐글 data_visualization/05-distributions<Kaggle-Course> 2023. 3. 17. 16:59
sns.histplot(iris_data['Petal Length (cm)']) sns.kdeplot(data=iris_data['Petal Length (cm)'], shade=True) # 2D KDE plot sns.jointplot(x=iris_data['Petal Length (cm)'], y=iris_data['Sepal Width (cm)'], kind="kde") # KDE plots for each species sns.kdeplot(data=iris_data, x='Petal Length (cm)', hue='Species', shade=True)
-
캐글 data_visualization/04-scatter-plots<Kaggle-Course> 2023. 3. 17. 16:52
sns.scatterplot(x=candy_data['sugarpercent'], y=candy_data['winpercent']) # Your code here sns.regplot(x=candy_data['sugarpercent'], y=candy_data['winpercent']) # Your code here sns.scatterplot(x='pricepercent', y='winpercent', hue='chocolate', data=candy_data) # Your code here sns.lmplot(x='pricepercent', y='winpercent', hue='chocolate', data=candy_data) # Your code here sns.swarmplot(x="chocol..
-
캐글 data_visualization/02-line-charts<Kaggle-Course> 2023. 3. 17. 16:47
from pandas.plotting import register_matplotlib_converters register_matplotlib_converters() # Set the width and height of the figure plt.figure(figsize=(16,6)) # Line chart showing how FIFA rankings evolved over time sns.lineplot(data=fifa_data)
-
캐글 data_cleaning/05-inconsistent-data-entry<Kaggle-Course> 2023. 3. 16. 18:52
# 시작과 끝의 공백을 없앤다 professors['Country'] = professors['Country'].str.strip() import fuzzywuzzy from fuzzywuzzy import process import chardet matches = fuzzywuzzy.process.extract("south korea", countries, limit=10, scorer=fuzzywuzzy.fuzz.token_sort_ratio)
-
캐글 data_cleaning/04-character-encoding<Kaggle-Course> 2023. 3. 16. 18:51
인코딩이란 무엇입니까? 문자 인코딩은 원시 이진 바이트 문자열(예: 0110100001101001)에서 사람이 읽을 수 있는 텍스트(예: "hi")를 구성하는 문자로 매핑하기 위한 특정 규칙 집합입니다. 다양한 인코딩이 있으며 원래 작성된 것과 다른 인코딩으로 텍스트를 읽으려고 하면 "mojibake(글자깨짐)"(mo-gee-bah-kay와 같이 말함)라는 스크램블된 텍스트로 끝납니다. mojibake의 예는 다음과 같습니다. æ–‡å—化ã?? "알 수 없는" 문자로 끝날 수도 있습니다. 특정 바이트와 바이트 문자열을 읽는 데 사용하는 인코딩의 문자 사이에 매핑이 없을 때 인쇄되는 내용이 있으며 다음과 같습니다. ���������� import charset_normalizer