실기
-
-
-
빅분기 실기 3회차 합격수기<자격증>/[빅데이터분석기사] 2021. 12. 24. 14:54
이렇게 미리 사전고지를 한걸 보면 아무래도 주최측에서 고치고자 하는게 많을 거 같아 사전 고지를 한 것 같습니다. 작업형 제 2유형의 경우, 무지성으로 랜덤포레스트를 사용했습니다. 사용했을 때 model.score() 결과, 0.78정도 나왔어서 대강 20점은 받겠다고 생각했습니다. 어차피 작업형 제 1유형은 다맞을거란 생각을 했었습니다.(30점 확보) 그래서 단답형이 어렵긴 했긴 했지만 확실히 10점은 맞추고자 했습니다. 혹시 몰라 20점은 받아야겠다 생각했지만 18점이 나왔네요. 이런 18 결과적으로 작업형 제 2유형에서 만점이 나왔고 이런 결과가 나와서 상당히 놀랐습니다. 결과적으론 제가 생각했던 공부법이 유효하게 맞아떨어진것 같습니다. 시간 남을 때 빅분기 5일 완성을 완성시켜야겠습니다.
-
ADP 실기(제 23회 데이터 분석 전문가)<자격증>/[ADP] 2021. 12. 19. 22:58
기계학습 50점 문제 1. 독립변수는 4개 (온도, 습도, 빛, CO2), 종속변수는 객실사용 여부(0, 1) 관측치 290개의 분류문제 1-1. 1-1-1. EDA 과정을 하고 결과를 제시하여라. 1-1-2. 결측치를 찾고 대안법을 제시하여라. 1-1-3. 데이터 질을 향상 시키기 위한 방법을 제시하여라.(구현 필요X) 1-2. 1-2-1. 데이터 불균형 식별하고 불균형을 처리할 오버샘플링 기법 선택하여 2개 기법 선정 1-2-2. 위 오버샘플링 기법에서 만든 데이터 세트 2개를 제시하고 장단점을 작성하여라. 1-2-3. 오버샘플링 데이터로 정확도 측면 모델 하나 속도 측면 모델 하나를 제작하여라 1-3. 1-3-1. 둘 중에 하나의 모델을 선택하고 분류결과와 함께 이유를 제시하여라. 1-3-3. ..
-
ADP 실기(제 21회 데이터 분석 전문가)<자격증>/[ADP] 2021. 12. 19. 22:57
adp 실기 1. 성별 결석 건강 -- 13개의 독립변수와 등급(GRADE) 1개의 종속변수 1-1. 1.시각화, 2.결측치를 어떻게 처리할것인지 최소 2가지 방법으로 나눠 만들고 더 좋은 것을 선택한다. 3.인코딩할 변수를 바꿔라 1-2. train과 test 셋을 최소 2가지 방법으로 나눠 만들고 더 좋은 것을 선택한다. 이유 첨부해야한다 1-3. 랜덤포레스트, SVM, XGBoost로 만들고 이 셋의 공통점을 적어라. 가장 좋은 모델 1개를 찾고 성능향상 시켜라 2. 2-1. train셋으로 선형회귀모형을 만들고 test셋으로 RMSE, R-square값을 구하여라 2-2. 릿지 모형 (0~1까지 0.1씩 증가하며) 최적의 alpha, RMSE값을 구하여라 2-3. 라쏘 모형 (0~1까지 0.1..
-
빅분기 실기 3회차 후기<자격증>/[빅데이터분석기사] 2021. 12. 4. 18:51
빅데이터 분석기사 3회 - 실기 후기 2회차 기출문제 + 제공 문제를 보니 작업형 문제가 조잡(?)한거 같아 R이 아닌 파이썬을 사용했습니다. 결국 시중에 있는 문제집을 이용하지 못했습니다. (책의 두께도 만만치 않아 짧은 시간 공부하기엔 적합하지 않다고 판단했습니다.) (필자는 위기주도 학습으로 5일 완성을 목표로 했습니다.) 먼저, 공식사이트에서 제공하는 작업환경(구름 goorm)에 있는 문제를 최대한 이용해 공부했습니다. 주피터 노트북이나 비쥬얼 스튜디오에서 풀어도 되지만 error 발생시 구름과 error의 결과 내용이 달랐기 때문입니다. 추천 : error 결과문 적응을 위해 구름에서 공부하시길 추천합니다. 단답형의 경우, 처음부터 어렵게 보였습니다. 초장에 많이 당황해서 절반정도 풀었던 것 같..
-
빅분기 실기 3회차 작업형 1번 기출<자격증>/[빅데이터분석기사] 2021. 12. 4. 18:09
빅데이터 분석기사 3회 - 실기 작업형 1번 문제 작업형 1 공식사이트 : https://dataq.goorm.io/exam/116674/%EC%B2%B4%ED%97%98%ED%95%98%EA%B8%B0/quiz/3 1-1번 작업형 1-1번 : 상위 70% 추출 + 사분위수 Q1의 값을 구하시오. import pandas as pd a = pd.read_csv('/data') a = a.iloc[: int(len(a)*0.7)] answer = a['x1'].describe()['25%'] print(answer) 작업형 1-1번(공식사이트에서 해보기) import pandas as pd X_train = pd.read_csv("data/X_train.csv") X_train = X_train.iloc[..