-
빅분기 실기 3회차 작업형 1번 기출<자격증>/[빅데이터분석기사] 2021. 12. 4. 18:09728x90
빅데이터 분석기사 3회
- 실기 작업형 1번 문제
작업형 1
공식사이트 : https://dataq.goorm.io/exam/116674/%EC%B2%B4%ED%97%98%ED%95%98%EA%B8%B0/quiz/3
1-1번
작업형 1-1번 : 상위 70% 추출 + 사분위수 Q1의 값을 구하시오.
import pandas as pd a = pd.read_csv('/data') a = a.iloc[: int(len(a)*0.7)] answer = a['x1'].describe()['25%'] print(answer)
작업형 1-1번(공식사이트에서 해보기)
import pandas as pd X_train = pd.read_csv("data/X_train.csv") X_train = X_train.iloc[: int(len(X_train)*0.7)] answer = X_train['내점일수'].describe()['25%'] print(answer)
1-2번
작업형 1-2번 : 2000년도 감염자 수의 평균보다 큰 나라의 개수를 구하시오.
import pandas as pd a = pd.read_csv('/data') mean = a[a.index == 2000].mean(axis = 1) answer = a[a.columns()[0]>mean].tolist() answer = len(answer) print(answer)
작업형 1-2번(공식사이트에서 해보기)
import pandas as pd X_train = pd.read_csv("data/X_train.csv") mean = X_train[X_train.index == 2000].mean(axis = 1) answer = X_train[X_train.columns()[0]>mean].tolist() answer = len(answer) print(answer)
1-3번
작업형 1-3번 : 결측치의 비율이 가장 높은 변수명을 구하시오.
import pandas as pd a = pd.read_csv('/data') print((a.isnull().sum()/len(a)).sort_values(ascending=False).index[0])
작업형 1-3번(공식사이트에서 해보기)
import pandas as pd X_train = pd.read_csv("data/X_train.csv") print((X_train.isnull().sum()/len(X_train)).sort_values(ascending=False).index[0])
728x90'<자격증> > [빅데이터분석기사]' 카테고리의 다른 글
빅분기 실기 유의사항 - 채점기준 (0) 2021.12.04 빅분기 실기 3회차 후기 (0) 2021.12.04 빅분기 실기 3회차 작업형 2번 기출 (1) 2021.12.04 빅데이터 분석기사 필기 두음암기 (0) 2021.12.03 빅분기 필기시험 결과(합격) (0) 2021.12.03