본문 바로가기
반응형

tts2

[토이 프로젝트 1] 내 목소리로 동화책 읽어주는 AI 만들기 - 학습 & TEST 동화책 읽어주는 AI 만들기 - 학습 & TEST  이번 글은 토이 프로젝트 1에 대한 내용으로 '내 목소리로 동화책 읽어주는 AI 만들기'의 학습 & TEST를 해본 후기에 대한 글입니다. 지난 글에서는 동영상 파일로부터 오디오 데이터를 추출하고 이를 슬라이싱한 다음에 Whisper 모델을 통해서 스크립트와 함께 슬라이싱 데이터를 추출해보았습니다. 따라서 이번에는 추출된 입력 데이터를 가지고 Coqui에서 제공하는 xTTS라는 인공지능 모델에 학습하고 이를 테스트해보는 것을 확인하도록 하겠습니다.  사용 데이터 : 개인 발표 녹화 영상 (약 13분)프로그래밍 환경 : 개인 컴퓨터 (GPU : NVIDIA TITAN RTX , RAM 128)사용 프레임 워크 : Coqui TTS모델 : XTTS v2총 .. 2024. 11. 30.
[토이 프로젝트 1] 내 목소리로 동화책 읽어주는 AI 만들기 동화책 읽어주는 AI 만들기  최근 인공지능 분야에 대한 공고를 보면 대부분이 거대 언어, 음성 등의 LLM 등을 활용 경험이 있는 지원자들을 많이 뽑고 있습니다. 참으로 빠르게 바뀌는 세상에서 공부해야되는 것들이 참 많습니다. 생성형 AI 분야도 그렇고 모든 분야에 AI가 사용되고 있습니다. 따라서 이에 대한 경험을 조금 늘리고자, 이미 앞서 프로젝트를 수행하시고 소스를 오픈해주신 분들의 프로젝트를 따라하는 것 뿐만 아니라, 다양한 모델을 공부해보기 위해 이것 저것을 시도해보려고 합니다.   따라서 첫 번째 프로젝트는 '동화책 읽어주는 인공지능 만들기'입니다. 제가 개인적으로 프로젝트를 수행하면서 많은 도움을 받았던 '빵형의 개발도상국' 유튜브를 참고하면서 저도 만들어보도록 하겠습니다.    주 제 :.. 2024. 11. 22.
반응형