분류 전체보기
-
-
[데이터 전처리] - 결측치 in r<R>/[데이터 전처리] 2021. 12. 3. 19:59
summary(data) 1. 결측치, NA 개수 확인 방법 1 summary(data) 방법 2 dlookr :: diagnose(data) 방법 3 apply(data, 2, function(x) sum(is.na(x))) 2. 결측치 삭제 방법 1 na.omit(data) 방법 2 data[complete.cases(data),] # 전체 행 삭제 data[complete.cases(data[,11]),] #일부 행(11번째) 삭제 3. 결측치 대체 방법 1 data$X1
-
-
-
-
-
파이썬 기초 - numpy<Python>/[Numpy] 2021. 12. 3. 16:39
np.random.rand(n) # 균일분포 np.random.randn(n) # 정규분포 np.linspace(0, 5, n) #0~5사이의 n개의 수 np.minimum np.abs() np.sqrt np.square #제곱 np.median(df['x1']) np.var np.min np.max np.std np.quntile(df['x1'], 0.25) # 0.5, 0.75 np.mean # 결과를 정수로 → int(np.mean())
-
파이썬 Pandas DataFrame<Python>/[DataFrame] 2021. 12. 3. 16:39
1. 결측치 확인——————————————————————————————— 2. .isnull().sum() #결과는 시리즈형태 # 결측치 개수확인 3. df[df['x1'].isnull()] # 결측값 확인 실습 : https://9566.tistory.com/41 4. 데이터 제거————————————————————————————— 5. .drop(시리즈.index.tolist(), axis=1) # 변수 삭제 #drop안에 list가 들어가야함 6. .drop(columns=['x1', 'x2'], axis =1, inplace=True) # 열 제거 # inplace=True는 df에 바로 적용 7. .drop(columns={'x1', 'x2'}) 실습 : https://9566.tistory.c..