본문 바로가기
반응형

Personal Projects33

[토이 프로젝트 3] 말하는대로 범인의 몽타주를 그려주는 AI 만들기 Text to 몽타주 AI 만들기  벌써 3 번째 토이 프로젝트입니다. 이번에 진행하게 될 토이 프로젝트는 '말하는대로 범인의 몽타주를 그려주는 AI 만들기'입니다. 이번 AI는 텍스트를 작성하면 이를 기반으로 몽타주를 그려주는 기능을 수행하게 되는 데, 이전 토이 프로젝트 1, 2와 비교하여 시간이 많이 소요될 것 같습니다. 그래도 개인적으로 굉장히 재미있는 경험이 될 것 같아서 세 번째 프로젝트로 선정하고 따라해보게 되었습니다. 영상만 보아도 뭔가 보이지 않은 난잡한(?) 문제들이 있을거라 생각하여, 제 생각으로는 이것이 2024년의 마지막 프로젝트가 되지 않을까 싶습니다.    주 제 : Text to 몽타주 AI데이터 출처 : 페르소나 기반의 가상 인물 몽타주 데이터 (AI 허브)https://w.. 2024. 12. 6.
[토이 프로젝트 2] 여행지 추천 AI 만들기 - 데이터 전처리 & 학습 여행지 추천 AI 만들기 - 데이터 & 학습  이번에는 두 번째 토이 프로젝트인 여행지 추천 AI 만들기에서 입력 데이터로 사용될 데이터에 대해서 살펴보고 전처리 과정과 학습까지 모든 과정에 관해서 살펴보도록 하겠습니다. 먼저, 해당 프로젝트에 사용될 데이터는 'AI 허브'의 '국내 여행로그 데이터 (수도권)'입니다. AI 허브 홈페이지 링크 (https://www.aihub.or.kr/aihubdata/data/view.do?dataSetSn=71581)에 따라 바로 들어가시면 아래 사진과 같이 AI 허브에서 제공하는 데이터의 개요, 메타데이터 구조표, 데이터 통계 등등 다양한 정보를 확인하실 수 있습니다.    데이터에 관한 정보를 확인하신 분들은 다운로드 버튼을 클릭하시고 절차에 따라 다운로드를 진.. 2024. 12. 5.
[토이 프로젝트 2] 내 취향을 고려한 여행지 추천 AI 만들기 여행지 추천 AI 만들기  첫 번째 토이 프로젝트 이후, 두 번째로 진행하게 될 프로젝트는 '여행지 추천 AI 만들기'입니다. 최근에 몇몇 공고에도 추천과 관련된 AI 경험들을 원하는 공고들이 있었는 데, 이번 기회로 두 번째 토이 프로젝트는 추천 AI와 관련하여 빵형의 개발도상국 유튜브를 통해서 실습을 참고하고 이를 따라해보면서 여행지 추천 AI를 구현해보도록 하겠습니다.  주 제 : 여행지 추천 AI코드 : https://github.com/Muns91/Toy_project2_TR_recommend GitHub - Muns91/Toy_project2_TR_recommendContribute to Muns91/Toy_project2_TR_recommend development by creating an.. 2024. 12. 1.
[토이 프로젝트 1] 내 목소리로 동화책 읽어주는 AI 만들기 - 학습 & TEST 동화책 읽어주는 AI 만들기 - 학습 & TEST  이번 글은 토이 프로젝트 1에 대한 내용으로 '내 목소리로 동화책 읽어주는 AI 만들기'의 학습 & TEST를 해본 후기에 대한 글입니다. 지난 글에서는 동영상 파일로부터 오디오 데이터를 추출하고 이를 슬라이싱한 다음에 Whisper 모델을 통해서 스크립트와 함께 슬라이싱 데이터를 추출해보았습니다. 따라서 이번에는 추출된 입력 데이터를 가지고 Coqui에서 제공하는 xTTS라는 인공지능 모델에 학습하고 이를 테스트해보는 것을 확인하도록 하겠습니다.  사용 데이터 : 개인 발표 녹화 영상 (약 13분)프로그래밍 환경 : 개인 컴퓨터 (GPU : NVIDIA TITAN RTX , RAM 128)사용 프레임 워크 : Coqui TTS모델 : XTTS v2총 .. 2024. 11. 30.
[토이 프로젝트 1] 내 목소리로 동화책 읽어주는 AI 만들기 - 데이터 동화책 읽어주는 AI 만들기 - 데이터  이번 글은 현재 수행하고 있는 '동화책 읽어주는 AI 만들기'라는 저의 개인 토이 프로젝트에서 '데이터 처리'에 대한 글입니다. 영상에서는 5분 48초 이후에 해당하는 부분이고 데이터의 처리는 pip를 자유롭게 설치하고 싶은 생각에 구글 Colab에서 데이터를 처리하였습니다. 참고 영상에서는 YouTube의 영상을 처리하여 mp3 파일로 만드는 과정이 있지만 저 같은 경우는 제 목소리가 담긴 개인 발표 영상이 있어서, 이를 가공하여 학습을 위한 데이터를 생성하였습니다. 그럼 제가 수행했던 과정 살펴보도록 하겠습니다. 사용 데이터 : 개인 발표 녹화 영상 (약 13분)프로그래밍 환경 : Google Colab코드 : https://github.com/Muns91/T.. 2024. 11. 28.
[토이 프로젝트 1] 내 목소리로 동화책 읽어주는 AI 만들기 동화책 읽어주는 AI 만들기  최근 인공지능 분야에 대한 공고를 보면 대부분이 거대 언어, 음성 등의 LLM 등을 활용 경험이 있는 지원자들을 많이 뽑고 있습니다. 참으로 빠르게 바뀌는 세상에서 공부해야되는 것들이 참 많습니다. 생성형 AI 분야도 그렇고 모든 분야에 AI가 사용되고 있습니다. 따라서 이에 대한 경험을 조금 늘리고자, 이미 앞서 프로젝트를 수행하시고 소스를 오픈해주신 분들의 프로젝트를 따라하는 것 뿐만 아니라, 다양한 모델을 공부해보기 위해 이것 저것을 시도해보려고 합니다.   따라서 첫 번째 프로젝트는 '동화책 읽어주는 인공지능 만들기'입니다. 제가 개인적으로 프로젝트를 수행하면서 많은 도움을 받았던 '빵형의 개발도상국' 유튜브를 참고하면서 저도 만들어보도록 하겠습니다.    주 제 :.. 2024. 11. 22.
[생성 신경망] CGAN 모델 구현 Conditional GAN (CGAN) 실습 이전 글에서는 CGAN에 대한 이론을 살펴보았습니다. 그럼 이론을 살펴보았으니, 코드를 보면서 구현 실습을 하도록 하겠습니다. 코드에 대한 참고는 글 맨 하단에서 참고하실 수 있으며, 실습을 원하시는 분들은 제가 실습한 자료가 있는 깃 허브를 참고하시길 바랍니다. Development Environment : COLAB (T4 GPU) Language : Python Framework : Tensorflow Model : WGAN (based Wasserstein loss & Deep Convolutional Neural Network) 참고 : https://www.aladin.co.kr/shop/wproduct.aspx?ItemId=324278784 실습.. 2024. 4. 22.
[생성 신경망] 조건부 GAN (Conditional GAN, CGAN) Conditional GAN, CGAN 이번 글에서는 조건부 GAN(Conditional GAN, CGAN)이라고 부르는 CGAN 모델에 대해서 살펴보도록 하겠습니다. 기존 GAN부터 WGAN 모델에서는 주어진 훈련 세트에서 사실적인 이미지를 생성하는 GAN을 구축하였습니다. 하지만 생성하려는 이미지의 유형을 제어할 수 없다는 한계가 있습니다. 이 문제를 해결하기 위해 추가적인 정보를 GAN에 입력하여 생성 과정을 제어할 수 있는 방법을 모색했고, 이로인해 조건부 GAN이 탄생하게 되었습니다. 논문 : https://arxiv.org/abs/1411.1784 Conditional Generative Adversarial Nets Generative Adversarial Nets [8] were recen.. 2024. 4. 21.
[생성 신경망] WGAN 모델 구현 Wasserstein GAN (WGAN) 실습 지난 글에서는 WGAN에 대한 간단한 이론을 살펴보았습니다. 그럼 이론을 살펴보았으니 이제는 코드를 보면서 구현 실습을 하도록 하겠습니다. 코드는 글 맨 하단에서 확인하실 수 있는 책과 블로그 그리고 구현된 코드를 참고하였습니다. 실습을 원하시는 분들은 해당 사이트 및 제가 실습한 자료가 있는 깃허브를 참고하시길 바랍니다. Development Environment : COLAB (T4 GPU) Language : Python Framework : Tensorflow Model : WGAN (based Wasserstein loss & Deep Convolutional Neural Network) 참고 : https://www.aladin.co.kr/shop.. 2024. 4. 20.
[생성 신경망] 와서스테인 GAN (Wasserstein GAN, WGAN) - 이론 WGAN (Wasserstein GAN) 이번 시간에는 DCGAN에 이어서 WGAN (Wasserstein GAN)에 대해서 알아보도록 하겠습니다. WGAN은 기존 GAN의 몇 가지 문제점을 개선하기 위해 설계된 신경망 모델입니다. 이 모델은 Wasserstein 거리를 사용하여 두 분포 간의 거리를 측정합니다. 이 새로운 접근 방식은 GAN의 학습 과정을 더 안정적으로 만들고 더 높은 품질의 결과를 생성할 수 있게 하였습니다. 논문 : https://arxiv.org/pdf/1701.07875.pdf 그럼, 우선적으로 와서스테인 GAN에 대해서 살펴보기 전에, 기존의 GAN에서 발생하는 문제점들을 살펴보도록 하겠습니다. GAN은 생성 모델링 분야에서 커다란 혁신이지만 훈련이 어렵기로 잘 알려진 모델입니.. 2024. 4. 19.
반응형