업스테이지패스트캠퍼스 15

한식 이미지 생성 모델

Upstage AI Lab 5기 교육과정 중 마지막 프로젝트로 기업 연계 프로젝트를 진행하였다.기업명: 커넥트브릭(connectbrick)팀 주제: 한국 음식 메뉴 이미지 생성 모델(Text-to-Image) 개발과제 추진 배경: 대부분의 오픈소스 모델들은 한국 음식에 대한 이해도가 낮아, 실제와 거리가 있는 이미지를 생성목표: 고퀄리티 실사 이미지 기반의 한국 음식 이미지 생성 모델을 학습 및 파인튜닝하여, 보다 실제 사진 같은 이미지를 생성주요 작업고품질 한식 이미지 수집 및 캡셔닝다양한 T2I 모델(SD, Flux, Janus 등) 파인튜닝 시도LoRA 기반 경량 모델 학습 실험ControlNet, VAE 등 보조기법과의 통합 실험기간: 2025. 3. 21 ~ 2025. 4. 14구체적인 이미지 ..

Upstage AI Lab 5기 2025.04.26

Upstage-AI-Lab-5-Langchain프로젝트

LangChain을 이용한 "QA Engine 개발"과 "App 개발" PJT 중에서 우리 팀은 "App 개발"을 하기로 하였다 프로젝트 기간 : 2025년 2월 10일(월) ~ 2월 14일(금)프로젝트 발표 : 2.14(금)LangChain을 이용해서 특정 페르소나를 가지는 Generative Agents를 구축, 응용한 Chatbot을 개발기분과 상황에 맞춘 음식 및 레시피 추천, 식재료 관리 및 주문 개발 환경 및 기술 스택 주 언어 : python버전 및 이슈관리 : github협업 툴 : slack, notion, Zoom구현 기능기능1 (Natural User Interface):STT-TTS 기반 음성 지시/응답 기능기능2 (Front-end): Streamlit 기반 채팅 홈페이지기능3 (..

Upstage AI Lab 5기 2025.02.19

Upstage-AI-Lab-5-NLP경진대회

Upstage AI Lab 5기 NLP 경진대회-. 대회 기간: 2025. 1. 15 ~ 2025. 1. 27   이번 NLP 경진대회는 주어진 대화 내용을 요약하는 모델을 개발하는 대회이었다. 모델 성능을 평가하는 방법은 모델이 생성한 요약 문장을 3개의 정답 요약 문장과 비교하여 metric의 평균 점수를 산출하는 방식으로 이루어졌다. 사용된 metric은 ROUGE-1-F1, ROUGE-2-F1, ROUGE-L-F1, 총 3가지 종류이고 이들 metric으로부터 산출된 평균 점수를 더하여 최종 점수를 계산한다. 3개의 정답 요약 문장의 metric 평균 점수를 활용하기에 metric 점수가 100점이 만점이 아니며, 3개의 정답 요약 문장 중 하나를 랜덤하게 선택하여 산출된 점수가 약 70점 정도이..

Upstage AI Lab 5기 2025.02.09

Upstage-AI-Lab-5-CV경진대회

CV(Computer Vision) Image Classification 경진대회 -. 대회 기간: 2024. 12. 26 ~ 2025. 1. 2 -. 개요: 데이터 부족, 품질 문제, 라벨링 오류 등 여러 제약을 분석, 개선하면서 Computer Vision 모델의 성능을 최적화   다양한 image들을 17개의 클래스로 얼마나 정확하게 분류하는지를 평가하는 대회이었다.   클래스가 라벨링된 학습용 데이터는 1570개이고 클래스로 분류해야 하는 라벨링되지 않은 평가용 데이터는 3140개로 학습용 데이터 개수가 작아 데이터 증강이 필요하였다.  또한 학습용 데이터와는 달리 평가용 데이터는 이미지가 선명하지 않거나 회전되어 있어서 주어진 1570개의 학습용 데이터를 사용하여 학습한 모델로 평가용 데이터를 ..

Upstage AI Lab 5기 2025.02.09

Deep Learning 학습 시작...

31주간 진행되는 Upstage AI Lab 5기 교육이 13주차에 접어들었다.전체 교육 기간의 약 40%가 지난 시점이다.지금까지 무엇을 했는지, 앞으로 무엇을 하게 될지 잠시 멈춰 정리해 보았다. Python Programming (1, 2 주차)통계학 (3주차)컴퓨터 공학 개론 (4, 5주차)Git (5주차)Machine Learning (6, 7주차)ML 경진대회 (8주차)Machine Learning & MLOps (9주차)ML 프로젝트 (10, 11주차)Deep Learning, PyTorch (12주차)Computer Vision: Basic/Advanced (13, 14주차)CV 경진대회 (Image Classification) (14, 15주차)Computer Vision: Generat..

Upstage AI Lab 5기 2024.12.16

데이터 전처리부터 모델 서빙까지의 경험

* 비정제 한국어 데이터 수집 및 감성 분석 - Upstage AI Lab 5기 MLOps 프로젝트 MLOps 프로젝트를 진행하였다. MLOps (Machine Learning Operations)는 머신 러닝 모델을 더 쉽고 효율적으로 개발하고 배포하며, 운영할 수 있게 도와 주는 프로세스와 도구들이다. 머신 러닝 모델을 만드는 과정부터 운영 환경에 배포하는 과정까지 이어주는 역할을 한다.  우리 팀이 진행한 프로젝트는 비정제 한국어 데이터를 수집 및 감성 분석이었다. 네이버 영화 리뷰 데이터셋을 감성 분석하여 긍정/부정으로 구분하는 작업으로 모델 학습을 시켰고 추가 한국어 데이터를 실시간 수집하기 위해서 웹 크롤링을 하였다.    강의 시간에 MLOps에 대해서 들었지만 추상적인 개념처럼 느껴지는 면..

Upstage AI Lab 5기 2024.12.10

서울 아파트 가격 예측 - Upstage AI Lab 5기 ML 경진대회

이번 경진대회는 서울의 아파트 실거래가 데이터를 기반으로 아파트 실거래가를 예측하는 대회이었다.  2007년 1월부터 2023년 6월까지의 서울의 아파트 거래 관련 데이터 1,118,822건이 학습 데이터로 주어졌고 2023년 7월부터 2023년 9월까지의 서울의 아파트 거래 관련 데이터 9,272건이 평가 데이터로 주어졌다. 주어진 데이터에는 실거래가 정보 이외 각 거래 건별로 51가지 항목의 데이터가 있었다.    실거래가가 포함된 학습 데이터로 머신러닝 프로세스를 진행하여 실거래가가 제외된 평가 데이터의 각 거래의 실거래가를 예측해 보고 예측한 실거래가와 실제 실거래가의 RMSE(Root Mean Square Error)를 최소화하도록 머신러닝 프로세스를 개선하는 문제이다.    이러한 문제를 해결..

Upstage AI Lab 5기 2024.12.10

Fork를 활용한 Git 작업 절차

"Git은 이번 생에 처음이라..." Fork를 활용한 전형적인 Git 작업 절차를 단계별로 정리해 보았습니다. Fork → Clone → 작업 브랜치 생성 → 커밋 및 푸시 → PR 생성 → 리뷰 및 수정 → 병합 이러한 절차는 원본 리포지토리와 독립적으로 작업할 수 있게 해 주며, 변경 사항을 검토한 후 원본에 반영(Pull Request)할 수 있는 체계적인 방식입니다. GitHub에서 Fork를 사용한 Git 작업 절차1. GitHub에서 리포지토리 Fork원본 리포지토리(Fork 대상)에 기여하고자 할 때, Fork를 통해 자신의 GitHub 계정에 복사본을 생성합니다.예시: https://github.com/upstream-username/repository-name 리포지토리를 Fork하여 ..

Upstage AI Lab 5기 2024.10.28

Data Structure and Algorithms (3)

Linked List and Hash Table Array vs. Linked ListArray(배열)는 “연속된 메모리 공간”에 “같은 타입”의 데이터를 순차적으로 저장하는 자료구조이고 Linked List는 array와 다르게 생성 후에 자유롭게 원소를 추가/삭제할 수 있는 자료구조입니다.  ArrayArray는 index를 통해 빠르게 접근할 수 있습니다.Array는 크기가 고정되어 있기 때문에 array를 생성할 때 크기를 지정해 주어야 합니다.Array가 가득 차는 경우 새로운 데이터를 추가할 수 없거나 기존 데이터를 삭제해야 할 수 있습니다. Linked ListLinked List는 가변적인 길이를 가지고 있기 때문에, 새로운 데이터 추가에 대한 제한이 거의 없다는 장점이 있습니다.Linke..

Upstage AI Lab 5기 2024.10.23

Data Structure and Algorithms (2)

Stacks and Queues StackStack은 LIFO(Last-In First-Out) 구조를 가진 자료구조입니다. Stack 구조는 컴퓨터 가상메모리의 Stack 영역에서 사용되는데, 함수가 호출되면서 다시 복귀할 주소를 저장하거나, 지역변수, 매개변수 등을 임시로 저장하는데에 쓰입니다. Stack의 구현은 Array나 List 모두 가능합니다. (파이썬에서는 List를 통해 구현) Stack에 대한 기본적인 기능(Basic operations)에는 push, pop, top, isFull(배열로 구현된 경우), isEmpty 가 있습니다.push: stack의 가장 뒤에 새로운 요소를 삽입.pop: stack의 가장 뒤 요소(top)를 제거 후 return.top: stack의 가장 뒤 요소..

Upstage AI Lab 5기 2024.10.23