반응형 AI 프로젝트4 [토이 프로젝트 3] 범인의 몽타주 그려주는 AI - 학습 (1), VQVAE Text to 몽타주 AI 만들기 - 학습 (1) 이번 글은 범인의 몽타주를 그려주는 AI 만들기의 학습 (1)입니다. 전처리와는 다르게... 왜 안되지? 를 혼자 중얼거리며 GPT와 구글의 도움을 받으면서 겨우 겨우 학습했던 시간이었습니다. 대부분은 영상과 비슷하지만, 약간의 차이가 있음을 알려드리면서 이번 학습 (1) 과정을 살펴보도록 하겠습니다. 사용 데이터 : 페르소나 기반의 가상 인물 몽타주 데이터프로그래밍 환경 : 개인 컴퓨터 (GPU : NVIDIA TITAN RTX, RAM 128)모델 : VQVAE총 학습 시간 : 약 24 시간데이터 링크 (AI 허브)링크 : https://www.aihub.or.kr/aihubdata/data/view.do?dataSetSn=618 AI-Hub샘플.. 2024. 12. 13. [토이 프로젝트 3] 말하는대로 범인의 몽타주를 그려주는 AI 만들기 Text to 몽타주 AI 만들기 벌써 3 번째 토이 프로젝트입니다. 이번에 진행하게 될 토이 프로젝트는 '말하는대로 범인의 몽타주를 그려주는 AI 만들기'입니다. 이번 AI는 텍스트를 작성하면 이를 기반으로 몽타주를 그려주는 기능을 수행하게 되는 데, 이전 토이 프로젝트 1, 2와 비교하여 시간이 많이 소요될 것 같습니다. 그래도 개인적으로 굉장히 재미있는 경험이 될 것 같아서 세 번째 프로젝트로 선정하고 따라해보게 되었습니다. 영상만 보아도 뭔가 보이지 않은 난잡한(?) 문제들이 있을거라 생각하여, 제 생각으로는 이것이 2024년의 마지막 프로젝트가 되지 않을까 싶습니다. 주 제 : Text to 몽타주 AI데이터 출처 : 페르소나 기반의 가상 인물 몽타주 데이터 (AI 허브)https://w.. 2024. 12. 6. [토이 프로젝트 1] 내 목소리로 동화책 읽어주는 AI 만들기 - 학습 & TEST 동화책 읽어주는 AI 만들기 - 학습 & TEST 이번 글은 토이 프로젝트 1에 대한 내용으로 '내 목소리로 동화책 읽어주는 AI 만들기'의 학습 & TEST를 해본 후기에 대한 글입니다. 지난 글에서는 동영상 파일로부터 오디오 데이터를 추출하고 이를 슬라이싱한 다음에 Whisper 모델을 통해서 스크립트와 함께 슬라이싱 데이터를 추출해보았습니다. 따라서 이번에는 추출된 입력 데이터를 가지고 Coqui에서 제공하는 xTTS라는 인공지능 모델에 학습하고 이를 테스트해보는 것을 확인하도록 하겠습니다. 사용 데이터 : 개인 발표 녹화 영상 (약 13분)프로그래밍 환경 : 개인 컴퓨터 (GPU : NVIDIA TITAN RTX , RAM 128)사용 프레임 워크 : Coqui TTS모델 : XTTS v2총 .. 2024. 11. 30. [토이 프로젝트 1] 내 목소리로 동화책 읽어주는 AI 만들기 - 데이터 동화책 읽어주는 AI 만들기 - 데이터 이번 글은 현재 수행하고 있는 '동화책 읽어주는 AI 만들기'라는 저의 개인 토이 프로젝트에서 '데이터 처리'에 대한 글입니다. 영상에서는 5분 48초 이후에 해당하는 부분이고 데이터의 처리는 pip를 자유롭게 설치하고 싶은 생각에 구글 Colab에서 데이터를 처리하였습니다. 참고 영상에서는 YouTube의 영상을 처리하여 mp3 파일로 만드는 과정이 있지만 저 같은 경우는 제 목소리가 담긴 개인 발표 영상이 있어서, 이를 가공하여 학습을 위한 데이터를 생성하였습니다. 그럼 제가 수행했던 과정 살펴보도록 하겠습니다. 사용 데이터 : 개인 발표 녹화 영상 (약 13분)프로그래밍 환경 : Google Colab코드 : https://github.com/Muns91/T.. 2024. 11. 28. 이전 1 다음 반응형