본문 바로가기

Personal Projects/Toy Projects9

[토이 프로젝트 3] 범인의 몽타주 그려주는 AI - 학습 (1), VQVAE Text to 몽타주 AI 만들기 - 학습 (1)  이번 글은 범인의 몽타주를 그려주는 AI 만들기의 학습 (1)입니다. 전처리와는 다르게... 왜 안되지? 를 혼자 중얼거리며 GPT와 구글의 도움을 받으면서 겨우 겨우 학습했던 시간이었습니다. 대부분은 영상과 비슷하지만, 약간의 차이가 있음을 알려드리면서 이번 학습 (1) 과정을 살펴보도록 하겠습니다.  사용 데이터 : 페르소나 기반의 가상 인물 몽타주 데이터프로그래밍 환경 : 개인 컴퓨터 (GPU : NVIDIA TITAN RTX, RAM 128)모델 : VQVAE총 학습 시간 : 약 24 시간데이터 링크 (AI 허브)링크 : https://www.aihub.or.kr/aihubdata/data/view.do?dataSetSn=618  AI-Hub샘플.. 2024. 12. 13.
[토이 프로젝트 3] 범인의 몽타주 그려주는 AI - 데이터 전처리 Text to 몽타주 AI 만들기 - 데이터 전처리  이번 글은 세 번째 토이 프로젝트의 데이터 전처리에 대한 글입니다. 또 다시 시작된 가상 환경 설정, pip install, Error, 그리고 Wandb까지... 등등 힘겨운 우열곡절(?) 끝에 겨우 학습을 시킨 후, 토이 프로젝트 3에 대한 글을 쓸 수 있게 되었습니다.  데이터 전처리의 경우는 경로 설정 등의 부분 빼고는 대부분 영상을 따라하시면 되고, 약간의 오타(?) 부분을 수정하면 데이터 전처리를 수행할 수 있습니다. 그럼 데이터 전처리 과정에 대해서 살펴보도록 하겠습니다.  사용 데이터 : 페르소나 기반의 가상 인물 몽타주 데이터데이터 링크 (AI 허브)링크 : https://www.aihub.or.kr/aihubdata/data/view.. 2024. 12. 11.
[토이 프로젝트 3] 말하는대로 범인의 몽타주를 그려주는 AI 만들기 Text to 몽타주 AI 만들기  벌써 3 번째 토이 프로젝트입니다. 이번에 진행하게 될 토이 프로젝트는 '말하는대로 범인의 몽타주를 그려주는 AI 만들기'입니다. 이번 AI는 텍스트를 작성하면 이를 기반으로 몽타주를 그려주는 기능을 수행하게 되는 데, 이전 토이 프로젝트 1, 2와 비교하여 시간이 많이 소요될 것 같습니다. 그래도 개인적으로 굉장히 재미있는 경험이 될 것 같아서 세 번째 프로젝트로 선정하고 따라해보게 되었습니다. 영상만 보아도 뭔가 보이지 않은 난잡한(?) 문제들이 있을거라 생각하여, 제 생각으로는 이것이 2024년의 마지막 프로젝트가 되지 않을까 싶습니다.    주 제 : Text to 몽타주 AI데이터 출처 : 페르소나 기반의 가상 인물 몽타주 데이터 (AI 허브)https://w.. 2024. 12. 6.
[토이 프로젝트 2] 여행지 추천 AI 만들기 - 데이터 전처리 & 학습 여행지 추천 AI 만들기 - 데이터 & 학습  이번에는 두 번째 토이 프로젝트인 여행지 추천 AI 만들기에서 입력 데이터로 사용될 데이터에 대해서 살펴보고 전처리 과정과 학습까지 모든 과정에 관해서 살펴보도록 하겠습니다. 먼저, 해당 프로젝트에 사용될 데이터는 'AI 허브'의 '국내 여행로그 데이터 (수도권)'입니다. AI 허브 홈페이지 링크 (https://www.aihub.or.kr/aihubdata/data/view.do?dataSetSn=71581)에 따라 바로 들어가시면 아래 사진과 같이 AI 허브에서 제공하는 데이터의 개요, 메타데이터 구조표, 데이터 통계 등등 다양한 정보를 확인하실 수 있습니다.    데이터에 관한 정보를 확인하신 분들은 다운로드 버튼을 클릭하시고 절차에 따라 다운로드를 진.. 2024. 12. 5.
[토이 프로젝트 2] 내 취향을 고려한 여행지 추천 AI 만들기 여행지 추천 AI 만들기  첫 번째 토이 프로젝트 이후, 두 번째로 진행하게 될 프로젝트는 '여행지 추천 AI 만들기'입니다. 최근에 몇몇 공고에도 추천과 관련된 AI 경험들을 원하는 공고들이 있었는 데, 이번 기회로 두 번째 토이 프로젝트는 추천 AI와 관련하여 빵형의 개발도상국 유튜브를 통해서 실습을 참고하고 이를 따라해보면서 여행지 추천 AI를 구현해보도록 하겠습니다.  주 제 : 여행지 추천 AI코드 : https://github.com/Muns91/Toy_project2_TR_recommend GitHub - Muns91/Toy_project2_TR_recommendContribute to Muns91/Toy_project2_TR_recommend development by creating an.. 2024. 12. 1.
[토이 프로젝트 1] 내 목소리로 동화책 읽어주는 AI 만들기 - 학습 & TEST 동화책 읽어주는 AI 만들기 - 학습 & TEST  이번 글은 토이 프로젝트 1에 대한 내용으로 '내 목소리로 동화책 읽어주는 AI 만들기'의 학습 & TEST를 해본 후기에 대한 글입니다. 지난 글에서는 동영상 파일로부터 오디오 데이터를 추출하고 이를 슬라이싱한 다음에 Whisper 모델을 통해서 스크립트와 함께 슬라이싱 데이터를 추출해보았습니다. 따라서 이번에는 추출된 입력 데이터를 가지고 Coqui에서 제공하는 xTTS라는 인공지능 모델에 학습하고 이를 테스트해보는 것을 확인하도록 하겠습니다.  사용 데이터 : 개인 발표 녹화 영상 (약 13분)프로그래밍 환경 : 개인 컴퓨터 (GPU : NVIDIA TITAN RTX , RAM 128)사용 프레임 워크 : Coqui TTS모델 : XTTS v2총 .. 2024. 11. 30.
[토이 프로젝트 1] 내 목소리로 동화책 읽어주는 AI 만들기 - 데이터 동화책 읽어주는 AI 만들기 - 데이터  이번 글은 현재 수행하고 있는 '동화책 읽어주는 AI 만들기'라는 저의 개인 토이 프로젝트에서 '데이터 처리'에 대한 글입니다. 영상에서는 5분 48초 이후에 해당하는 부분이고 데이터의 처리는 pip를 자유롭게 설치하고 싶은 생각에 구글 Colab에서 데이터를 처리하였습니다. 참고 영상에서는 YouTube의 영상을 처리하여 mp3 파일로 만드는 과정이 있지만 저 같은 경우는 제 목소리가 담긴 개인 발표 영상이 있어서, 이를 가공하여 학습을 위한 데이터를 생성하였습니다. 그럼 제가 수행했던 과정 살펴보도록 하겠습니다. 사용 데이터 : 개인 발표 녹화 영상 (약 13분)프로그래밍 환경 : Google Colab코드 : https://github.com/Muns91/T.. 2024. 11. 28.
[토이 프로젝트 1] 내 목소리로 동화책 읽어주는 AI 만들기 동화책 읽어주는 AI 만들기  최근 인공지능 분야에 대한 공고를 보면 대부분이 거대 언어, 음성 등의 LLM 등을 활용 경험이 있는 지원자들을 많이 뽑고 있습니다. 참으로 빠르게 바뀌는 세상에서 공부해야되는 것들이 참 많습니다. 생성형 AI 분야도 그렇고 모든 분야에 AI가 사용되고 있습니다. 따라서 이에 대한 경험을 조금 늘리고자, 이미 앞서 프로젝트를 수행하시고 소스를 오픈해주신 분들의 프로젝트를 따라하는 것 뿐만 아니라, 다양한 모델을 공부해보기 위해 이것 저것을 시도해보려고 합니다.   따라서 첫 번째 프로젝트는 '동화책 읽어주는 인공지능 만들기'입니다. 제가 개인적으로 프로젝트를 수행하면서 많은 도움을 받았던 '빵형의 개발도상국' 유튜브를 참고하면서 저도 만들어보도록 하겠습니다.    주 제 :.. 2024. 11. 22.
[토이 프로젝트] TOY PROJECT 목록 Toy Procject 목록   이번 글은 저의 개인 인공지능 프로젝트에 대한 Toy Procject에 대한 목록입니다. 여기서 '토이 프로젝트'란 개인 혹은 소규모 그룹이 남는 시간을 쪼개서 단기 프로젝트를 개발하는 것으로서 주로 상업적인 목적보다는 개인적인 깨달음이나 능력 향상, 새로운 아이디어나 기술 개발 등을 위해 수행하는 프로젝트입니다.  저 같은 경우는 ML/DL을 사용한 연구 혹은 프로젝트의 대부분은 주로 5G 이동통신 네트워크와 관련이 되어 있고 그 밖의 의료, 소형 자율주행 로봇 그리고 에너지 등의 연구를 수행하였습니다.   취업에 있어서 자격증 또는 기업 시험을 준비하는 것도 정말 중요한 일이지만, 개인적으로 'AI 개발자'라면 끊임없이 자신의 영역을 확장하면서 본인의 영역 외에도 다양.. 2024. 11. 22.
반응형