'딥러닝 머신러닝/대회' 카테고리의 글 목록
본문 바로가기
728x90
반응형

딥러닝 머신러닝/대회5

[이어드림스쿨 3차 모의대회] 자연스러운 영한 번역문 생성 과제 2, 3일차 자연스러운 영한 번역문 생성 과제 이번에 진행한 과정은 다음과 같습니다. GPT API를 이용한 FewShot Learing 모델의 기본적인 성능 테스트 GPT API를 이용한 FewShot Learning 먼저, pip install를 진행합니다. !pip install openai import os import openai openai.api_key = "api" response = openai.ChatCompletion.create( model="gpt-3.5-turbo", messages=[ {"role": "system", "content": "You will be provided with a sentence in English, and your task is to translate it int.. 2023. 11. 1.
[이어드림스쿨 3차 모의대회] 자연스러운 영한 번역문 생성 과제 1일차 자연스러운 영한 번역문 생성 과제 이어드림 마지막 모의 경진 대회가 시작했습니다. 이번 주제는 NLP로 영어를 한글로 번역하는 과제입니다. NLP는 자신 없지만, 최선을 다해서 Top 10안에 도달하는 것이 목표입니다. 대회설명 PDF파일로 제공된 대회설명입니다. train데이터가 7만여건, test데이터가 1만여 건으로 데이터가 굉장히 많습니다. train데이터 일부입니다. text데이터를 이용해서 target으로 번역해야 합니다. 제한사항입니다. 추가로 외부데이터는 사용불가능합니다. 평가지표는 번역평가에 자주 이용하는 BLEU입니다. 파파고 API 사용 BART기반 모델을 사용하니 train속도가 굉장히 느립니다. 그래서 train하는 동안 파파고API를 사용해서 제출해보려고 합니다. 먼저, API를.. 2023. 10. 30.
[이어드림스쿨 2차 모의대회]이미지 기반 제품 결함 탐지 정리(2~6일차) 및 후기 이미지 기반 제품 결함 탐지 대회 중간에 추석 연휴가 있고, 연휴 동안 감기에 걸려서 하루종일 잠을 잤습니다.(감기 조심하세요) 약을 먹고 잠시 기운이 생길 때 대회를 조금씩 진행하면서 기록했습니다. 물론, 아파서 포스팅 못했어요;; 어느덧 대회 마지막 날입니다!! 그동안 진행한 내용과 후기를 정리했습니다. 2일차 2일 차에는 Resnet34, Efficientnet을 사용하고 테스트를 진행했습니다. 그리고 모델 네트워크를 구조를 변경했습니다. ResNet34 기존 ResNet18을 사용해서 한번 ResNet34를 사용했습니다. 결과는 CV 0.42, LB 0.82로 오히려 점수가 떨어졌습니다. 점수가 떨어진 원인은 모델이 무거워서 오버피팅했다고 생각됩니다. Efficientnet_b0 이어서 Effic.. 2023. 10. 6.
[이어드림스쿨 2차 모의대회]이미지 기반 제품 결함 탐지 1일차 이미지 기반 제품 결함 탐지 이어드림스쿨에서 2차 모의 경진 대회가 진행되었습니다. 저번 1차 모의 경진대회에서 많은 것을 시도했지만, 결과는 오버피팅으로 순위가 바닥을 쳤습니다. 하지만, 괜찮습니다. 덕분에 시도했던 것이 오버피팅을 유발할 수 있다는 것을 배웠습니다. 이번 대회는 꼭! 순위권에 진입하는 것이 목표입니다! 대회설명 이번 대회는 제품 이미지에 결함이 존재하는지 판별하는 분류문제입니다. 위와 같은 이미지를 주어지는데 여기서 결함이 있으면 1, 없으면 0으로 분류합니다. 평가는 F1 Score로 평가합니다. 제한 사항은 다음과 같습니다. 외부 데이터 사용 불가 최대 일 5회 제출 Public은 30, Private는 70입니다. 데이터 설명 주어진 데이터는 다음과 같습니다. 학습데이터(6820.. 2023. 9. 28.
[이어드림스쿨 1차 모의대회]119 신고 접수량 예측 후기 이어드림스쿨에서 모의 경진 대회를 진행했다. 이번에 진행하는 대회는 시계열예측으로 119 신고 접수량을 예측하는 대회다. 대회 목적 및 평가방식 대회 목적은 9~17시 신고 건수를 예측하는 것이 목적이다. 평가방식은 MAPE이다. EDA 및 전처리 어떤 데이터를 이용해야 예측을 잘 할 수 있을지 파악하기 위해 EDA를 진행했다. 데이터 분석 일단, 대회에서 주어진 데이터다. 데이터를 보고 생긴 의문점과 추가하고 싶은 컬럼은 다음과 같다. 접수경로, 시군구, 접수분류, 긴급구조종류가 신고 건수에 영향을 줄까? 시계열 문제인데 9시~17시 데이터가 없다? 회귀 문제로 풀어야 하나? 휴일 데이터 추가 1일 평균 이동 평균 시간별 긴급주조 종류 휴일 데이터 추가 휴일에 신고건수가 많아진다는 말을 들었다. 그래서.. 2023. 9. 10.
728x90
반응형