728x90
반응형

tave 7

[TAVE 7기] 활동 후기

같이해서 가치있었던 TAVE!! 오늘은 제가 활동했었던 TAVE 활동 후기를 전해드리겠습니다~~ 2021년 상반기에 활동했고 후에는 같이 활동했었던 친구들과 대회도 같이 나갔어요! 후기 들려드릴께요 TAVE에 들어가게 된 계기 1. 데이터사이언티스트가 되고싶었지만 정보가 부족했었다. 2. 머신러닝과 딥러닝에 관하여 학습도 하고 싶었고 팀프로젝트를 하고 싶었다.. 3. 코로나19로 인하여 선배들과 만날 기회도 없었고 같은 관심사를 가진 사람들과 교류가 힘든 상황이었다. 이때 눈에 들어온 TAVE 모집 공고! TAVE에 들어가기위한 자격요건?!?! 비전공자, 전공자 아~무 상관없는거같아요, 오히려 제가 보기엔 비전공자 비율이 많았던거같은 느낌?!이었습니다. 데이터 분석, 개발, 머신러닝 등에 관심이 있음을 ..

대외 활동 2022.08.16

데이콘 주차수요 예측 AI 경진대회 후기와 느낀점

안녕하세요~! 2021년 1학기동안 Tave동아리에서 전반기 활동으로 머신러닝 기초스터디+대학교 기계학습 수업을 들으면서 머신러닝과 딥러닝에 대해서 이론위주로 공부했다면, 후반기에는 머신러닝 캐글 실전 스터디를 하면서 경진대회에 관해서 학습했습니다!! 방학동안 실전에 적용하기 위해 스터디 팀원들과 팀프로젝트로 구내식당 식수 인원 예측 AI경진대회를 진행하였고 팀프로젝트가 끝날 무렵 혼자서 데이콘 주차수요 예측 AI 경진대회를 진행해 보았습니다.!! https://dacon.io/ 데이터사이언티스트 AI 컴피티션 3만 AI팀이 협업하는 인공지능 플랫폼 dacon.io 이 글에서는 주차수요 예측 AI경진대회를 하면서 후기와 느낀점에 대해서 말해볼까 합니다. 후기와 느낀점 1)프로그래밍에 관한 부분 경진대회를..

캐글 스터디 4주차 모델평가

"데이터가 뛰어노는 AI놀이터, 캐글" 참고하여 스터디를 진행하였고 책을 바탕으로 발표용 ppt를 만들었습니다. 문제가 있을 시 댓글 남겨주시거나 이메일 totoma3@naver.com 으로 연락주시기 바랍니다! 목차 검증 방법 층화 K-겹 검증 분류 문제에서 폴드마다 포함되는 클래스의 비율을 서로 맞출 때가 자주 있는데 이것을 층화추출이라고 부른다. 가정) 테스트 데이터에 포함되는 각 클래스의 비율은 학습 데이터에 포함되는 각 클래스의 비율과 거의 같을 것이라는 가정에 근거하여 검증의 평가를 안정화하려는 방법이다. StratifiedKFold 클래스로 층화추출을 통한 검증을 수행할 수 있다. Kfold 클래스와 달리 층화추출을 위해 split 메서드의 인수에 목적변수를 입력해야 한다. 홀드아웃 검증으로..

캐글 스터디 3주차 차원 축소와 비지도학습의 특징, 기타 기법

"데이터가 뛰어노는 AI놀이터, 캐글" 참고하여 스터디를 진행하였고 책을 바탕으로 발표용 ppt를 만들었습니다. 문제가 있을 시 댓글 남겨주시거나 이메일 totoma3@naver.com 으로 연락주시기 바랍니다! 목차 주성분 분석 데이터 준비 import numpy as np import pandas as pd # train_x는 학습 데이터, train_y는 목적 변수, test_x는 테스트 데이터 # pandas의 DataFrame, Series의 자료형 사용(numpy의 array로 값을 저장하기도 함.) train = pd.read_csv('C:/Users/Administrator/Desktop/2021년 1학기/tave동아리/후반기 활동/ppt/input/train_preprocessed..

캐글 스터디 2주차 특징생성

"데이터가 뛰어노는 AI놀이터, 캐글" 참고하여 스터디를 진행하였고 책을 바탕으로 발표용 ppt를 만들었습니다. 문제가 있을 시 댓글 남겨주시거나 이메일 totoma3@naver.com 으로 연락주시기 바랍니다! 모델과 특징 신경망의 특징 베이스라인 결측값 특정한 값을 결측값으로 처리하려면 데이터를 읽어들일 때 인수(argument)로 지정한다. 다음과 같이 pandas 모듈의 read.csv함수에서 na_values인수로 결측값을 지정할 수 있다. #결측값을 지정하고 train.csv 불러오기 train=pd.read.csv('train.csv', na_values=['','NA',-1,9999] 다만!! 어떤 변수에서는 -1을 결측값으로 다루는데 다른 변수에..

캐글 스터디 1주차 평가지표

"데이터가 뛰어노는 AI놀이터, 캐글" 참고하여 스터디를 진행하였고 책을 바탕으로 발표용 ppt를 만들었습니다. 문제가 있을 시 댓글 남겨주시거나 이메일 totoma3@naver.com 으로 연락주시기 바랍니다! import numpy as np import pandas as pd RMSE 코드 from sklearn.metrics import mean_squared_error # y_true는 실젯값이고, y_pred는 예측값이다. y_true = [1.0, 1.5, 2.0, 1.2, 1.8] y_pred = [0.8, 1.5, 1.8, 1.3, 3.0] #RMSE는 MSE에 루트를 씌운것이다. rmse = np.sqrt(mean_squared_error(y_true, y_pred)) print(rms..

728x90
반응형