분류 전체보기(21)
-
NLP 경진대회 회고
프로젝트 진행 기간 (11월 11일 - 11월 29일)프로젝트 주제주제 : 주어진 일상 대화를 바탕으로 요약문 생성하기목표 : Rouge-1, Rouge-2, Rouge-l 점수 최적화최소2턴, 최대 60턴으로 대화가 구성되어 있습니다. 대화(*dialogue)를 보고 이에 대한 요약(*summary) 를 예측하는 것이 최종 목표 학습시 사용한 데이터train : 12457dev : 499test : 250hidden-test : 249fname : 대화 고유번호 입니다. 중복되는 번호가 없습니다.dialogue : 최소 2명에서 최대 7명이 등장하여 나누는 대화 내용입니다. 각각의 발화자를 구분하기 위해#Person”N”#: 을 사용하며, 발화자의 대화가 끝나면 \n 으로 구분합니다. 이 구분자를 기준..
2024.12.02 -
CV 경진대회 회고
프로젝트 진행 기간 (10월 29일 - 11월 08일)프로젝트 주제주제 : 17개의 class 문서 타입 분류목표 : 최근 기업에서 디지털, 전산화가 많이 이루어지다보니 그 초기 작업으로 이 문서가 어떤 문서인지 판별하는게 매우 중요하다. 현업에서도 문서분류 Task가 원활하도록 CV Model을 만들어보자. 학습시 사용한 데이터Upstage 내부 데이터셋 (비공개 원칙)팀 개발 문화나뿐만 아니라 다른 팀원 분도 이전 프로젝트를 진행하며 밀린 강의가 좀 있어서 각자 공부하고 최종 마지막 한 주에 모여서 개발하는 문화로 갔다. 그리고 이번엔 처음으로 팀장을 해보았다. 그렇게 어렵지는 않았다. 근데 조금 아쉬운 것은 팀장인데 좀 더 열심히 하면 어땠을까 생각해본다. 그래도 주어진 환경에서 최선을 다했고, 결..
2024.11.10 -
Pytorch, DL 공부
후후 원래 이 블로그는 3주 전에 작성되어야 하는게 맞지만 경진대회+현생이 바빴던 이유로 지금 작성합니다...다음 블로그는 CV 경진대회 블로그로 찾아오겠습니다:) Pytorch란?딥러닝을 위한 framework다.framework가 뭐냐? 공구 상자라고 생각하면 된다. 어떤 걸 고치기 위해서 드라이버, 벤치가 한 번에 다 있으면 좋듯이 Pytorch는 딥러닝을 하기 위해 필요한 도구가 한 번에 모여 있다고 생각하면 된다. 예전에 Tenserflow로 입문하려고 했는데 트렌드를 보니까 Pytorch가 더 많이 사용되고 있다고 해서 빠르게 바꾼 기억이... 학습 하며이번 강의는 Pytorch를 전문적으로 알려준다기보다 기본적인 내용을 포괄적으로 다루었다.그리고 좋았던 건 딥러닝에서 자주 쓰이는 말들에 대한..
2024.11.09 -
MLOps Project 회고
프로젝트 진행 기간 (9월 26일 - 10월 11일)실질적 프로젝트 기간은 위에 적어 놓은 기간과 같다.프로젝트를 진행함에 있어서 필요한 지식들은 사전에 이미 다 교육을 했다.프로젝트 주제주제 : 배운 MLOps를 적용하기 위한 프로젝트목표 : 시각 장애인들에게 손쉽게 OTP인식이 가능하도록 MLOps 진행. 시각 장애인이 손글씨로 비밀번호를 입력하면 이를 인식하여 음성으로 인식된 숫자를 읽어주는 기능, 인식된 숫자는 모델 재학습에 이용. 학습시 사용한 데이터MNIST datasetEMNIST dataset주제 선정 접근 방식이번 프로젝트에서 함께하는 팀원들의 참여도가 좋지 않았다.나를 포함한 5명 중 2명은 취업, 대학원 면접이 수시로 있어서 집중해서 회의하기도 어려웠고,다들 ML경진 대회 이후라서 그..
2024.10.12 -
MLOps 강의를 들으며
강의 내용녹강은 없었다. 100% 줌 수업이었다. MLflow, Docker, Airflow등 실험기록하고 배포하는 내용이 많았다.이전 대회에서 하이퍼파라미터 조절을 하면서 실험을 했는데 이걸 체계적으로 기록할 수 있는 도구가 있으면 좋겠다고 생각하고 있었는데 MLflow가 많은 도움이 될 수 있을 것 같아서 좋은 도구를 배웠다. 배우는 시간이 너무짧아서 사실상 배웠다고 보기는 어렵고 맛봤다가 정확한 표현인 것 같다.나중에 혼자서 다시 공부하면서 조금더 많이 알아가면 유용하겠다는 생각을 했다. 이후에는 AWS, FastAPI, Stremlit을 이용해서 모델을 배포하는 것을 해봤는데 솔직히 말하면 수업 퀄리티가 너무 별로였다.(MLflow는 좋았음. 100% 이해는 아니지만 그래도 좀 되었음)수업 시간에..
2024.09.25 -
ML 경진 대회 (feat. 부동산 가격 예측)
프로젝트 진행 기간 (8월 26일 - 9월 13일)첫 프로젝트가 지나고 두 번째 프로젝트가 시작되었다.Python 모듈 개발이 아닌 본격적으로 ML 경진대회로 시작했다. 그래도 ML이랑 DL관련해서 학교에서 MNIST 데이터 셋 분류를 해본 경험이 있어서 생각보다 수월하리라 생각했다. 프로젝트 진행기간에는 공부 기간도 있었고, 실질적으로 프로젝트에 온전히 집중한 것은 9/9-13 한 주라고 봐야 한다.프로젝트 주제주제 : 아파트 가격 예측 (House Price Prediction)목표 : 서울시 아파트 실거래가 예측 모델 개발평자 지표 : Root Mean Squared Error (RMSE) 제공 데이터아파트 실거래가 데이터 (국토교통부 제공)지하철 정보 데이터 (서울시 제공)버스 정류장 정보 데이터..
2024.09.18