25 동계 모각코
-
25 동계 모각코 2주차 활동.25 동계 모각코 2025. 1. 27. 09:50
일자 25/01/20활동QI 프로그램의 프로젝트 주제와 관련한 논문중 SMOTE 방법을 이용한 논문을 읽고 이해하기. SMOTE (Synthetic Minority Oversampling technique)을 이용하여, 불균형한 데이터 셋을 균형있게 만들어서 예측 모델의 성능을 향상시킴. -전처리 과정-1. 결측값 50%이상을 가진 feature(column)삭제.2. EDA기법으로 26개의 feature 선택. EDA?->Exploatory Data Analysis (탐색적 데이터 분석)데이터의 분포 파악: 변수들이 어떻게 분포되어 있는지 확인 (평균, 중앙값, 표준편차 등)이상치(Outlier) 탐색: 극단적인 값이 있는지 확인하여 처리할지 결정결측치(Missing Values) 확인: 데이터가 비..