안녕하세요~!
2021년 1학기동안 Tave동아리에서 전반기 활동으로 머신러닝 기초스터디+대학교 기계학습 수업을 들으면서 머신러닝과 딥러닝에 대해서 이론위주로 공부했다면, 후반기에는 머신러닝 캐글 실전 스터디를 하면서 경진대회에 관해서 학습했습니다!! 방학동안 실전에 적용하기 위해 스터디 팀원들과 팀프로젝트로 구내식당 식수 인원 예측 AI경진대회를 진행하였고 팀프로젝트가 끝날 무렵 혼자서 데이콘 주차수요 예측 AI 경진대회를 진행해 보았습니다.!!
이 글에서는 주차수요 예측 AI경진대회를 하면서 후기와 느낀점에 대해서 말해볼까 합니다.
<데이터에 관한 것이나 코드리뷰같은 더 자세한 내용은 대회규정 위반이므로 후기와 느낌점에 대해서만 적겠습니다.>
후기와 느낀점
1)프로그래밍에 관한 부분
경진대회를 진행하면서 python을 다루는 능력이 더 필요하다는 점을 깨달았습니다.
물론 시간이 걸리긴하지만 구글링과 책 서적을 보면서 원하는 내용을 코드화 할 수는 있었지만(아직,,,많은 영역을 알 지 못하여) 코드를 이해하는데 힘든 부분이 많았고 직접 원리를 이해하며 원할하게 진행하기 위해 프로그래밍 공부(프로그래머스, 백준 알고리즘, SW expert academy)를 남은 방학동안 꾸준히 풀기로 생각했습니다.
2)머신러닝, 딥러닝에 관한 부분
학교 수업과 동시에 책으로 동아리 팀원들과 열심히 공부하였지만 막상 적용하기에는 어려운 부분들이 많았습니다. 뒤에서 다시한번 언급할 내용이지만 왜 이 모델을 써야만하는지 자기자신이 납득이 가지 않은채로 성능이 높게 나오는 점수만 보고 적용하였습니다.(결론적으로는 과적합이 되었지만요,,,)
다음 경진대회나 실무에서는 좀 더 모델링을 할 때 원리를 자세히 파악하고 적용하고 특징행렬을 만들 때도 왜? 이게 꼭 들어가야하지? 자기자신한테 얘기해 보고 납득이 갔을때 적용하려고 합니다.
3)Public 점수에 너무 맹신한 부분
경진대회를 진행하면서 내 코드가, 내 분석이, 내 예측이 잘 되고 있는 건지 Public 리더보드 점수에 너무 연연했던 점이 아쉬웠던 부분입니다. 대회 전에도 Public점수에 연연하지 않는게 좋다는 글을 많이 읽었는데 역시 직접 경험해 봐야,,아는 거 같습니다
등수 변화 그래프
그 후로는 50등 밖으로 나가 랭킹차트 안에서 제 닉네임은 볼 수 없었습니다(ㅜㅜ)
최종 Public 등수
최종 Private 등수
Private와 점수차이가 많이 나죠,,많이 과적합된 코드같습니다.
앞으로 고쳐야 할 점과 방향 정리
1. 매일 일정한 문제 수 만큼 프로그래밍 문제 풀 것
2. 머신러닝, 딥러닝 이론에 관해서 복습 겸 원리 공부 할 것
3. 대회를 진행할 때 Public 리더보드를 너무 맹신하지 말 것
좀 더 갈고 닦아 높은 순위를 할 수 있도록 노력해보겠습니다!!
만약 문제가 있을 시 연락주시면 수정/삭제 조치 하겠습니다. 글 읽어주셔서 감사합니다!