글로벌 인재 트랙 동계 해외 파견 [학습편]
안녕하세요.
글로벌 인재 트랙 9기에 선발된 학생입니다.
저희는 해외 파견일정이 의도치않게 변경되어서 미국 캘리포니아 샌디에고에 위치한
Qualcomm institute(QI)에서 진행하는 Ai Winter program에 참가하게 되었습니다.
해당 글은 Qi에서 배운 내용,프로젝트, Tip 정도만 작성하였으니
샌디에고 생활이나 다른 이야기는 [여행편] 을 참고해 주세요. :)
QI 프로그램에서는 정형 데이터를 바탕으로 Machine Learning 기법을 적용하여
Regression 또는 Prediction model을 만드는 프로젝트를 주로 진행합니다.
6주간 프로젝트 진행과 함께 QI에서 ML관련 강의를 같이 진행합니다.
또한 Qi 프로그램 담당 교수님과의 session도 있습니다.
강의는 영어로 진행되며, 매주 모든 조의 Weekly presentation 이 있습니다.
프로젝트에 KNIME이라는 Tool을 같이 사용하는데, 해당 Tool과 관련된 강의 또한 포함되어 있습니다.
Qi 강의는 다음과 같습니다.
- ML 이론 강의.
- Linear regression, Logistic regression, Decision tree, Random Forest, Clustering, PCA, MLP 등 - KNIME을 이용한 데이터 처리, ML실습.
- KNIME에서 Data processing, EDA 및 ML이론에서 배운 알고리즘 실습.
프로젝트 진행 개요는 다음과 같습니다.
- 주제 선정
- 데이터 셋 탐색
- 선행 논문 탐색 / 학습
- 데이터 셋 분석
- 데이터 셋 전처리
- 모델 학습
- 모델 평가
보통 데이터 셋을 먼저 찾고 해당 데이터 셋을 바탕으로 주제를 선정하는 것 같습니다. 저희 조 또한 동일한 방법으로 진행했습니다.
데이터 셋 탐색같은 경우 어디서 찾아야 할지 모를 수 있는데, Qi 프로그램 이전 기수분들이 작성한 논문들을 참고하면 좋습니다.
선행 논문 탐색 / 학습과 데이터 셋 분석에 가장많은 시간을 투자하게 됩니다. 데이터 분석을 해본 경험이 있다면 도움이 많이 됩니다. 제 경우 이러한 경험이 없다보니 많이 어려웠습니다.
데이터 전처리 및 모델 학습의 경우 KNIME을 보통 사용합니다.
물론 다른 것을 사용해서 진행할 수 있는데, (ex, Pytorch, Tensorflow 등) 보통 시간이 부족해서 KNIME을 사용하게 됩니다.
모든 과정에서 담당 교수님과의 session을 통해 피드백을 진행합니다.
담당 교수님 말고도 강의 해주시는 분들, TA분들과도 피드백을 받을 수 있습니다.
----------- Tip ---------
1. TA, 강연 하시는분, 담당 교수님 등 프로젝트 진행에 있어서 피드백을 받는게 엄청 중요합니다. 해당 시간 잘 활용하시기 바랍니다.
2. KNIME은 선행학습할 필요는 없을 것 같습니다.
KNIME보다는 데이터 분석 (ex. EDA)같은 것을 미리해보는게 더 도움될 것 같습니다.
kaggle 플랫폼에서 다른 분들이 진행한 데이터 분석같은것 참고해보면 도움이 될 것 같네요.
Kaggle: Your Machine Learning and Data Science Community
Kaggle is the world’s largest data science community with powerful tools and resources to help you achieve your data science goals.
www.kaggle.com
3. 선행논문 열심히 보세요. 이해도 중요하고, 해당 방법 적용해볼 수 있으면 더 좋습니다.