<자격증>/[빅데이터분석기사]

빅분기 실기 3회차 작업형 1번 기출

9566 2021. 12. 4. 18:09
728x90

 

빅데이터 분석기사 3회

- 실기 작업형 1번 문제

 

작업형 1

공식사이트 : https://dataq.goorm.io/exam/116674/%EC%B2%B4%ED%97%98%ED%95%98%EA%B8%B0/quiz/3

 

 

1-1번

 

작업형 1-1번 : 상위 70% 추출 + 사분위수 Q1의 값을 구하시오.

import pandas as pd

a = pd.read_csv('/data')
a = a.iloc[: int(len(a)*0.7)]
answer = a['x1'].describe()['25%']
print(answer)

 

작업형 1-1번(공식사이트에서 해보기)

import pandas as pd

X_train = pd.read_csv("data/X_train.csv")

X_train = X_train.iloc[: int(len(X_train)*0.7)]
answer = X_train['내점일수'].describe()['25%']
print(answer)

 

1-2번

 

작업형 1-2번 : 2000년도 감염자 수의 평균보다 큰 나라의 개수를 구하시오.

import pandas as pd

a = pd.read_csv('/data')
mean = a[a.index == 2000].mean(axis = 1)

answer = a[a.columns()[0]>mean].tolist()
answer = len(answer)
print(answer)

 

작업형 1-2번(공식사이트에서 해보기)

import pandas as pd
X_train = pd.read_csv("data/X_train.csv")

mean = X_train[X_train.index == 2000].mean(axis = 1)

answer = X_train[X_train.columns()[0]>mean].tolist()
answer = len(answer)
print(answer)

 

1-3번

 

작업형 1-3번 : 결측치의 비율이 가장 높은 변수명을 구하시오.

import pandas as pd

a = pd.read_csv('/data')
print((a.isnull().sum()/len(a)).sort_values(ascending=False).index[0])

 

작업형 1-3번(공식사이트에서 해보기)

import pandas as pd

X_train = pd.read_csv("data/X_train.csv")
print((X_train.isnull().sum()/len(X_train)).sort_values(ascending=False).index[0])

 

728x90