반응형 빵형의 개발 도상국2 [토이 프로젝트 1] 내 목소리로 동화책 읽어주는 AI 만들기 - 학습 & TEST 동화책 읽어주는 AI 만들기 - 학습 & TEST 이번 글은 토이 프로젝트 1에 대한 내용으로 '내 목소리로 동화책 읽어주는 AI 만들기'의 학습 & TEST를 해본 후기에 대한 글입니다. 지난 글에서는 동영상 파일로부터 오디오 데이터를 추출하고 이를 슬라이싱한 다음에 Whisper 모델을 통해서 스크립트와 함께 슬라이싱 데이터를 추출해보았습니다. 따라서 이번에는 추출된 입력 데이터를 가지고 Coqui에서 제공하는 xTTS라는 인공지능 모델에 학습하고 이를 테스트해보는 것을 확인하도록 하겠습니다. 사용 데이터 : 개인 발표 녹화 영상 (약 13분)프로그래밍 환경 : 개인 컴퓨터 (GPU : NVIDIA TITAN RTX , RAM 128)사용 프레임 워크 : Coqui TTS모델 : XTTS v2총 .. 2024. 11. 30. [토이 프로젝트 1] 내 목소리로 동화책 읽어주는 AI 만들기 - 데이터 동화책 읽어주는 AI 만들기 - 데이터 이번 글은 현재 수행하고 있는 '동화책 읽어주는 AI 만들기'라는 저의 개인 토이 프로젝트에서 '데이터 처리'에 대한 글입니다. 영상에서는 5분 48초 이후에 해당하는 부분이고 데이터의 처리는 pip를 자유롭게 설치하고 싶은 생각에 구글 Colab에서 데이터를 처리하였습니다. 참고 영상에서는 YouTube의 영상을 처리하여 mp3 파일로 만드는 과정이 있지만 저 같은 경우는 제 목소리가 담긴 개인 발표 영상이 있어서, 이를 가공하여 학습을 위한 데이터를 생성하였습니다. 그럼 제가 수행했던 과정 살펴보도록 하겠습니다. 사용 데이터 : 개인 발표 녹화 영상 (약 13분)프로그래밍 환경 : Google Colab코드 : https://github.com/Muns91/T.. 2024. 11. 28. 이전 1 다음 반응형