분류 전체보기
-
파이썬 Pandas Seires<Python>/[Series] 2021. 12. 3. 16:37
한 열 + 인덱스 = array([1, 2, 3, 4]) + 인덱스 4x1 형태 가장 바깥 []의 안의 가장 바깥 ,을 엔터(axis)라 생각 array([1, 2, 3, 4]) = 4x1 형태 # array([1,2,3,4], [5,6,7,8]) = 2x4 형태 데이터프레임의 부분 시리즈와 숫자 비교연산가능 ex) df_missing > 0 적용가능한 함수 조건—————————————————————————————————————- s=s[조건] #범위줄이기 s[조건].plot.bar() #그래프 그리기 개수세기———————————————————————————————————- len(s) # 길이확인, 개수세기 s.count() # 널값포함 개수세기 .sort_values(ascending=False) #..
-
빅데이터 분석기사 필기 두음암기<자격증>/[빅데이터분석기사] 2021. 12. 3. 16:32
----------------------------------------------------------------------------------------------------------------------------- 개인정보 익명처리법 가명-일반화-섭동-치환 가일섭치(과일섭취) 비식별 조치 가이드라인의 적정성 평가 프로세스 기초 자료 작성-평가단 구성-평가 수행-추가 비식별 조치-데이터 활용 기구수 추활 ----------------------------------------------------------------------------------------------------------------------------- 데이터 정확성 정확성-사실성-적합성-필수성-연관성 데..
-
SQLD 계층 문제 대비하기<자격증>/[SQLD] 2021. 12. 3. 16:30
SQLD 자격증 - 나만의 공부팁 계층 노드 문제들 필자는 40회 SQLD 시험 합격자입니다. 필자는 특히 계층노드 문제를 풀때 어려움을 겪었다. 사실 독학하는 입장에서는 답지 해설이 너무 부족했다. 이것만 공부하려고 따로 여러 시간을 공들여 구글링 했었다. 구글링하여 배운 것을 하나로 통합하기 위해 나만의 공식을 만들었다. 그림으로 그려 직관적인 이해가 가능하게끔 했습니다. 사실 자격증은 빠른 시간 안에 문제를 풀어내는 것이 합격 비법이기에.. 급할 땐 이해보다 나만의 암기법으로라도 문제를 풀 수 있는 능력을 기르는 것을 추천한다. ※ 개념 CONNECT BY PRIOR 자식 = 부모 ( 부모 -> 자식) ( 순방향 ↘) CONNECT BY 자식 = PRIOR 부모 ( 자식 -> 부모) ( 역방향 ↖)..
-
-
-
빅분기 작업형 2 모델링 - 회귀모델<자격증>/[빅데이터분석기사] 2021. 12. 3. 16:11
# 9. 회귀 모델 # 9-1. 선형 회귀(릿지/라쏘) from sklearn.linear_model import LinearRegression from sklearn.linear_model import Ridge from sklearn.linear_model import Lasso from sklearn.linear_model import ElasticNet model = ElasticNet() # 9-2. 결정나무 from sklearn.tree import DecisionTreeRegressor model = DecisionTreeRegressor(random_state=0) # 9-3. SVM from sklearn.svm import SVR model = SVR() # 9-4. 랜덤포레스트 fr..
-
빅분기 작업형 2 모델링 - 분류모델<자격증>/[빅데이터분석기사] 2021. 12. 3. 16:09
# 8. 분류 모델링 # 8-1. 랜덤포레스트 from sklearn.ensemble import RandomForestClassifier model1 = RandomForestClassifier(max_depth=10, n_estimators=100) model1.fit(new_X_train, new_y_train) print(model1.score(new_X_train, new_y_train)) predict = model1.predict_proba(X_val) pred = predict[:, 1] from sklearn.metrics import roc_auc_score print(roc_auc_score(y_val, pred)) # 8-2. 로지스틱 회귀 from sklearn.linear_mod..