본문 바로가기
Scrapbook/News Scrap

[기사 스크랩] "동영상 생성 AI 최강자 떴다"…오픈AI '소라' 출시에 빅테크도 일자리도 '충격'

by muns91 2024. 12. 12.
AI 뉴스

 

기사 제목 : "동영상 생성 AI 최강자 떴다"…오픈AI '소라' 출시에 빅테크도 일자리도 '충격'

기사 링크 : https://zdnet.co.kr/view/?no=20241210085111

 

"동영상 생성 AI 최강자 떴다"…오픈AI '소라' 출시에 빅테크도 일자리도 '충격'

동영상 생성 인공지능(AI) 최강자로 지목된 오픈AI의 '소라'가 드디어 모습을 드러내며 구글, 메타 등 경쟁자들을 긴장시키고 있다. 텍스트만으로도 빠른 시간 내에 원하는 동영상을 간편하게 만

zdnet.co.kr

 


본 문

 

 동영상 생성 인공지능(AI) 최강자로 지목된 오픈AI의 '소라'가 드디어 모습을 드러내며 구글, 메타 등 경쟁자들을 긴장시키고 있다. 텍스트만으로도 빠른 시간 내에 원하는 동영상을 간편하게 만들 수 있다는 점에서 일자리 위협을 느낀 예술가들의 반발도 더 커지는 모양새다.

 10일 업계에 따르면 오픈AI는 지난 9일(현지시간) 온라인 행사를 통해 '소라'를 정식 출시한다고 발표했다. 지난 2월 처음 공개한 후 10개월 만으로, 그간 일부 이용자들을 대상으로 테스트를 한 후 문제점을 보완해 왔다. 공개 됐을 당시 도쿄 밤거리를 걷고 있는 여성의 다리가 불안정하게 움직이는 등 환각 현상이 발견된 바 있다.

 '소라'는 이용자가 글로 프롬프트(명령어)를 넣으면 동영상을 생성해주는 AI로, 생성되는 동영상의 길이는 최대 20초다. 당초 최대 1분 길이의 동영상을 빠르게 제작할 수 있다고 오픈AI가 밝혔던 것에 비해선 상당히 시간이 줄었다. 

 이에 대해 오픈AI는 "최대한 많은 사람들이 소라에 접근할 수 있도록 하기 위해 성능과 확장성 사이의 균형을 맞춘 것"이라고 설명했다.

 '소라'는 텍스트뿐 아니라 이미지, 동영상에서 영감을 받아 동영상을 생성하는 것은 물론, 기존 동영상을 확장하거나 빠진 프레임을 채우는 '스토리보드' 기능도 제공한다. 오픈AI가 공개한 '우주에 떠 있는 토끼(a rabbit floating in outer space)'라는 프롬프트로 만든 데모 시연 영상에선 약 7초만에 5초짜리 동영상이 만들어져 이목을 집중시켰다. 만든 영상이 마음에 들지 않으면 프롬프트를 수정하거나 스토리보드를 고치면 된다.

 '소라'는 구글이 올해 1월 공개한 생성 AI 모델 '루미에르'가 단 5초 분량의 영상물을 제작해주는 것에 비해 월등한 기술력을 갖고 있다는 평가를 받고 있다. 이날부터 한국을 포함한 대부분의 국가에서 사용할 수 있지만 영국, 스위스, 유럽경제지역(EEA)은 이번에 출시가 제외됐다. 이는 이들 지역에서 테크 기업에 대한 규제가 강화하고 있는 데 따른 것으로, 영국 등에서의 정식 출시 일정은 미정이다.

 '소라'는 현재 '챗GPT 플러스', '챗GPT 프로'에 포함돼 기존 유료 이용자들은 이 동영상 AI 모델 이용에 대한 추가 비용을 지불할 필요 없이 이용할 수 있다. 월 20달러를 지불하는 '챗GPT 플러스' 이용자들은 매월 50개(480p 또는 그 이하 해상도), 월 200달러인 '챗GPT 프로' 구독자들은 매월 500개의 영상을 생성할 수 있다. 챗GPT 팀, 엔터프라이즈, 에듀 계정에선 소라를 쓸 수 없다.

 이번 일로 동영상 생성 AI 시장 경쟁은 과열되는 분위기다. 지난해 11월에는 스태빌리티 AI가 '스테이블 비디오 디퓨전'을, 올해 1월에는 마이크로소프트(MS)가 비디오 프레임의 움직임을 조작하는 동영상 생성 모델 '드래그누와'를 선보였다. 바이트댄스는 '매직비디오-V2'를, 애플도 2월 대형언어모델(LLM)을 활용해 동영상을 생성하는 '키프레이머'를 내놨다.

 오픈AI가 올해 2월 '소라'를 선보인 후에는 구글 동영상 생성 AI '비오(Veo)'와 중국 콰이쇼우 '클링', 미국 루마 AI '드림 머신', 런웨이 '젠-3 알파', 메타 '무비 젠' 등이 지금까지 공개됐다. 어도비도 지난 10월 '어도비 맥스' 행사에서 파이어 플라이 기반 동영상 AI를 발표하며 경쟁에 합류했고, 아마존도 이달 초 '리인벤트' 행사를 통해 동영상 생성 AI '노바 릴'을 처음 선보였다. 

 이에 따라 유튜브는 내년부터 동영상 생성 AI '비오'를 활용해 유튜브 쇼츠 영상을 만들 수 있게 할 계획이다. 메타는 '무비 젠'이 만든 AI 동영상을 인스타그램 등 SNS와 연계할 수 있도록 할 예정이다. 사용자들은 AI를 사용해 실감나는 릴스(인스타그램을 통해 공유할 수 있는 15초 이내 분량의 짧은 동영상)를 직접 만들어낼 수 있고 페이스북, 왓츠앱, 스레드 등 메타의 다른 SNS 플랫폼에도 공유할 수 있게 된다.

 파이낸셜타임스(FT)는 "메타의 무비 젠 AI 동영상 모델은 할리우드 영화 제작사, 동영상 콘텐츠 크리에이터, SNS 인플루언서들의 창조 작업용 툴로 사용되기를 원하고 있다"며 "메타는 영화 등 예능, 오락산업, 광고를 넘어 보다 광범위한 산업 분야에서 수익 창출 모델을 발굴하려고 하고 있다"고 분석했다.

 이처럼 본격적인 동영상 생성 AI 시대가 열리면서 영상 관련 산업은 큰 변화를 맞게 됐다. 영화, 애니메이션, 증강현실(AR) 및 가상현실(VR) 등 다양한 분야에서 활용할 수 있게 되면서 일자리를 위협 받는 이들도 상당해질 것으로 예상된다. 

실제 소니픽처스는 영화 제작 비용을 줄이기 위해 생성형 AI를 적극 활용하겠다고 공개적으로 밝힌 바 있다. 이미 코카콜라의 최근 홀리데이 캠페인과 같은 광고에선 AI로 제작된 콘텐츠가 등장하고 있다.

 영화 CG 일러스트레이터인 리드 사우든은 "2022년 미드저니(이미지 생성 AI)가 처음 나왔을 때 우리는 '귀엽다'며 비웃었다"며 "하지만 이제 사람들은 생성 AI 때문에 일자리를 잃고 있다"고 말했다.

 이에 지난해 미국 할리우드에선 배우와 작가를 중심으로 생성형 AI 활용에 대항하기 위해 파업을 벌이기도 했다. 자칭 '소라 PR(대외홍보) 퍼펫'이라고 부르는 예술가 그룹은 지난달 26일 오픈AI '소라'에 접속할 수 있는 프로그래밍 인터페이스(API)를 온라인에 공개하며 반발하는 모습을 보였다. 

 업계 관계자는 "오픈AI '소라'가 등장하며 많은 기업들에게 동영상 생성 AI 모델에 대한 강력한 동기가 생겼다"며 "여러 모델들이 한꺼번에 풀리면서 산업계, 특히 미디어 시장에 엄청난 반향을 일으킬 것으로 보인다"고 밝혔다.


추가 조사 내용

 

1. "오픈AI '소라'보다 낫다"…동영상 생성 AI 강자 런웨이, 新무기 공개

더보기

링크 : https://zdnet.co.kr/view/?no=20240619094147

 

"오픈AI '소라'보다 낫다"…동영상 생성 AI 강자 런웨이, 新무기 공개

오픈AI가 만든 '소라'에 맞서 동영상 생성 인공지능(AI) 모델들이 쏟아지고 있는 가운데 런웨이가 우수한 기술을 앞세워 최근 새로운 무기를 공개해 주목 받고 있다.19일 테크레이더, 벤처비트 등

zdnet.co.kr

 

 오픈AI가 만든 '소라'에 맞서 동영상 생성 인공지능(AI) 모델들이 쏟아지고 있는 가운데 런웨이가 우수한 기술을 앞세워 최근 새로운 무기를 공개해 주목 받고 있다.

 19일 테크레이더, 벤처비트 등 외신에 따르면 런웨이는 지난 17일 동영상 생성 AI 모델 '젠-3 알파(Zen-3 Alpha)'를 공개했다. 미국 스타트업 루마 AI가 '드림 머신'을 공개한 지 일주일 만이다.

 런웨이는 지난해 3월 본격적인 동영상 생성 AI 모델이라 할 수 있는 '젠-1(Gen-1)'을 출시했다. 프롬프트를 입력하거나 특정 이미지를 참조해 기존 영상을 새로운 영상으로 변환할 수 있는 모델이다. 또 한 달 뒤인 같은 해 3월에는 기존 모델을 '멀티모달' 기능으로 업그레이드한 '젠-2(Gen-2)'를 출시했다. '젠-1'에서 영상을 만들 때 원본 영상이 꼭 필요했다면 '젠-2'에서는 텍스트만으로도 영상을 만들어낼 수 있다.

 '텍스트 투 비디오'의 경우 2022년 메타나 구글이 이미 기술을 시연한 적 있다. 하지만 일반인들이 사용할 수 있게 프로그램을 풀지 않은 것과 달리 런웨이는 구독자들이 사용할 수 있도록 상용화해 서비스를 제공하고 있다.

 '젠-3 알파'도 텍스트 프롬프트, 정지 이미지 또는 사전 녹화된 비디오를 프롬프트로 사용한다. 이를 통해 다양한 감정 표현 및 카메라 움직임을 통해 10초 길이의 고품질의 매우 상세하고 사실적인 장면을 90초 안에 생성할 수 있다. 전작에 비해선 생성 속도, 충실도가 대폭 향상됐을 뿐만 아니라 생성 동영상의 구조, 스타일 및 모션 등을 세밀하게 제어할 수도 있다.

 런웨이는 지난 2월 오픈AI '소라' 출시 당시 "게임은 시작됐다"라고 전면전을 선언해 주목 받은 바 있다. 이날 '젠-3 알파'를 통해 만든 영상을 확인한 이들은 완성도가 높아 런웨이의 자신감이 과장이 아니라고 평가했다. 특히 영화처럼 연출 장면은 좋은 반응을 얻었다.

 런웨이는 '젠-3 알파'를 이번 주말쯤 유료 사용자에게 정식 공개할 예정이다. 현재는 월 12달러에 유료로 이용할 수 있다. 런웨이는 이후 무료 사용자에게도 점차 서비스를 확대한다는 방침이다.

 이처럼 최근 등장한 고퀼리티 동영상 생성 AI 중 정식 서비스를 시작하는 것은 런웨이가 처음이다. 

 런웨이는 "공개된 모든 영상은 수정 없이 '젠-3 알파'로 모두 제작됐다"며 "대규모 멀티모달 훈련을 위해 구축된 새로운 인프라에서 만들어진 첫 번째 모델"이라고 설명했다. 

 런웨이는 주요 엔터테인먼트 및 미디어 기업들과 제휴를 노리고 '젠-3'의 맞춤형 버전도 제작했다. 이 버전은 제작자의 예술적 의도에 맞춰 일관된 비디오를 생성하도록 한다. 또 생성된 캐릭터, 배경 및 요소들이 다양한 장면에서 일관된 외모와 행동을 유지할 수 있는 것이 특징이다. 

 런웨이는 "조만간 이 기술이 적용된 광고, 쇼트 비디오 등을 만나볼 수 있을 것으로 기대한다"며 "젠-3알파는 새로운 C2PA(콘텐츠 자격 증명) 출처 표준을 포함한 보호 장치와 함께 출시될 예정"이라고 밝혔다.

 런웨이 외에도 최근 여러 스타트업들이 동영상 생성 AI 모델을 잇따라 출시하며 시장 경쟁은 과열되는 분위기다. 올해 2월 오픈AI가 '소라(Sora)'를 선보인 이후 지난달 구글 동영상 생성 AI '비오(Veo)'와 중국 콰이쇼우 '클링', 미국 루마 AI '드림 머신' 등이 공개됐다.  

 앞서 지난해 11월에는 스태빌리티 AI가 '스테이블 비디오 디퓨전'을, 메타가 '에뮤' 동영상 생성기를 선보였다. 올해 1월에는 마이크로소프트(MS)가 비디오 프레임의 움직임을 조작하는 동영상 생성 모델 '드래그누와'를, 바이트댄스는 '매직비디오-V2'를 공개했다. 애플도 2월 대형언어모델(LLM)을 활용해 동영상을 생성하는 '키프레이머'를 내놨다. 미드저니는 조만간 비디오 모델을 내놓을 것으로 알려졌다.

 업계 관계자는 "오픈AI '소라'가 등장하며 많은 기업들에게 동영상 생성 AI 모델에 대한 강력한 동기가 생겼다"며 "여러 모델들이 하반기쯤 한꺼번에 풀리면 산업계, 특히 미디어 시장에 엄청난 반향을 일으킬 것으로 보인다"고 말했다.

 

2. '오픈AI 소라 경쟁자 등장'...구글, 동영상 생성 모델 ‘비오’ 공개

더보기

링크 : https://zdnet.co.kr/view/?no=20240515054140

 

'오픈AI 소라 경쟁자 등장'...구글, 동영상 생성 모델 ‘비오’ 공개

구글이 동영상 생성모델 ‘비오’를 공개하며 오픈AI의 ‘소라’와 맞서기에 나선다.14일(현지시간) 구글은 연례개발자 컨퍼런스 구글 I/O를 통해 동영상 생성모델 ‘비오’를 선보였다.비오는 1

zdnet.co.kr

 

 구글이 동영상 생성모델 ‘비오’를 공개하며 오픈AI의 ‘소라’와 맞서기에 나선다.

 14일(현지시간) 구글은 연례개발자 컨퍼런스 구글 I/O를 통해 동영상 생성모델 ‘비오’를 선보였다.

 비오는 1080p해상도로 1분 이상 길이의 영상을 생성할 수 있다. 이 동영상 생성모델은 프롬프트를 보다 정확하게 이해하고 따를 수 있도록 교육 데이터의 각 비디오 캡션에 더 많은 세부 정보를 추가해 개발된 것이 특징이다. 

 또한 고품질의 압축된 비디오 표현을 사용해 효율성도 향상시켰으며 영상 생성 시간도 단축됐다.

 자연어와 시각적 의미에 대한 높은 이해도를 갖춘 만큼 사용자가 프롬프터를 통해 세부적으로 작성하는 요구사항을 파악하고 이를 영상에 반영할 수 있다.

 예를 들어 타입랩스, 항공촬영 등 영화 촬영 기법 등을 프롬프터로 입력하면 이를 파악해 그대로 적용 가능하다.

 비오는 실제 영상 제작이나 편집을 보다 적극적으로 지원하는 것을 목표로 개발됐다. 이를 위해 텍스트 프롬프트와 함께 이미지를 입력으로 사용하여 비디오를 생성할 수 있는 기능을 지원한다.

 영상 제작의 기준이 되는 참조 이미지를 지원함으로써 사용자는 보다 일관성 있고 의도한 비디오를 생성할 수 있다. 더불어 원활한 편집을 위해 영상에서 특정 부분만 지정하는 마스크 영역 기능도 지원한다.

 또한 프롬프터를 이용해 스토리를 시리즈 형식으로 제작하면 1분으로 제한된 영상 길이를 넘어 연속성 있는 영상도 제작 가능하다. 이를 활용한다면 실제 영화 같은 영상물도 제작 가능하다는 것이 구글 측의 설명이다.

 


마무리

 여기까지 오늘의 기사 스크랩이었습니다. 오늘은 이슈가 되고 있는 OpenAI의 SORA 모델에 대한 기사를 스크랩하였습니다. 최근에 유튜브 알고리즘으로 SORA 사용법에 대한 영상이 계속 노출되고 있는 데, 월 30이라는 어마무시한(?) 비용을 보면서 (물론 GPT 사용료 포함입니다.) 취미 생활로는 조금 비싸겠다라는 생각을 해보았습니다. 하지만 AI를 통해서 이제는 전공자들의 소유물들이 일반인들도 쉽게 제작할 수 있는 큰 장점이 있고 이를 더 널리 그리고 다양한 분야에 사용할 수 있겠다라는 생각이 들었습니다. 추가적으로 기사는 SORA와 같이 Text To Video 모델에 대한 다른 기업들이 보유하고 공개한 기술에 대해서 알아보았습니다. AX 시대에서 취준생으로서 무엇을 보아야할지 그리고 무엇을 준비해야될 지 모르겠다 싶을 정도로 정말 빠르게 발전하고 있는 것 같습니다. 

반응형