AI 뉴스
- 기사 제목 : 투자비 폭증에 효율성도 떨어져…생성형 AI, 챗봇·추론·경량화로 출구 찾는다
- 기사 링크 : https://www.sedaily.com/NewsView/2DGVQV37ZF
본문 및 헤드라인
“GPT 모델에 한계가 있다는 질문에 ‘아니다(No)’라고 말할 수 있다.”
올 3월 서울경제신문과 만난 샘 올트먼 오픈AI 최고경영자(CEO)가 자신 있게 전한 말이다. 충분한 연산 자원이 투입된다면 현재 AI 모델의 기틀인 트랜스포머로 범용인공지능(AGI)을 구현하는 데 전혀 문제가 없다는 뜻으로 읽혔다. 당시 올트먼 CEO는 AI 인프라 개선을 위한 7조 달러(약 1경 원) 규모의 글로벌 펀딩을 추진하는 중이었다.
올트먼 CEO의 자신감은 연산량 투입과 비례해 AI 성능이 개선되는 ‘규모(scaling)의 법칙’에서 비롯됐다. 실제 2월 올트먼 CEO는 규모의 법칙이 적용될 것이라며 “규모의 법칙은 신이 정하고 기술진은 AI 모델 내 상수를 결정할 뿐”이라고 주장하기도 했다.
하지만 최근 들어서는 이러한 관측에 의문이 쏟아지고 있다. AI 혁명 최전선에 자리한 고위 인사들이 잇따라 ‘AI 발전은 느려지고 있다’고 지적하고 나선 것이다. 최근 오픈AI 투자사인 벤처캐피털(VC) 앤드리슨호로위츠(a16z)의 벤 호로위츠 공동창업자는 “AI를 훈련하는 데 사용되는 그래픽처리장치(GPU) 수를 같은 속도로 늘리고 있으나 지능 개선이 전혀 이뤄지지 않고 있다”고 밝혀 충격을 줬다.
오픈AI 공동창업자이자 수석과학자로서 ‘올트먼 축출 사건’을 일으켰던 일리야 수츠케버도 최근 로이터와의 인터뷰에서 “AI 모델 사전 훈련 확대에 따른 결과가 정체되고 있다”는 우려를 드러냈다. 디인포메이션은 오픈AI가 GPT-5 개발 과정에서 겪고 있는 어려움이 구글 제미나이 2.0 개발 과정에서 똑같이 나타나고 있다고 보도했다. 막대한 데이터를 투입해 훈련시켰지만 기대만큼의 성능 개선이 이뤄지지 않아 신형 AI 모델의 출시가 지연되고 있다는 것이다.
2022년 11월 챗GPT 등장 이후 AI 혁명의 도래를 의심치 않던 테크계로서는 이 같은 속도 지연 현상이 ‘AI 버블’에 대한 우려를 키우는 요소로 작용하고 있다. 불과 1년 전인 2023년 말은 생성형 인공지능(AI) 성능 경쟁이 절정에 달하던 때였다. 당시 화두는 ‘초거대 AI 경쟁’이었다. 포문은 지난해 11월 첫 개발자회의를 연 오픈AI가 열었다. 오픈AI는 GPT-4를 한층 개선한 ‘GPT-4 터보’를 공개했다. 성능이 개선된 한편 더 긴 텍스트를 인식할 수 있게 됐고 이미지·음성 인식까지 가능한 멀티모달 AI가 나오며 시장에 충격을 안겼다. 이어 12월에는 생성형 AI 원조인 구글이 제미나이 울트라·프로 1.0을 선보이며 AI 경쟁에 본격적으로 뛰어들었다. 해를 넘겨 올해 2월에는 구글이 제미나이 1.5를 선보였고 오픈AI 라이벌로 꼽히는 앤스로픽도 클로드-3을 선보이며 생성형 AI 대전이 펼쳐졌다.
당시만 해도 ‘거대화’를 통한 성능 개선에 집중하던 AI 업계는 6개월 전부터 분위기가 급변했다. 5월에 선보인 오픈AI GPT-4o는 빠른 응답 속도와 모델 경량화, 그리고 자연스러운 대화 기능에 방점을 찍었다. 구글도 연례개발자회의 구글 I/O 2024에서 경량화한 제미나이 1.5 플래시와 대화·시각인식을 강화한 프로젝트 아스트라를 공개했다. 앤스로픽 역시 6월에 기존 대비 2배 빨라진 클로드-3.5를 선보였다. 주요 AI개발사들이 경량화 및 챗봇 기능 도입에 주력하기 시작한 것이다.
올 하반기 들어서는 ‘추론’과 ‘서비스 세분화’로 분화하는 양상이 더욱 뚜렷해졌다. 추론에 투입하는 시간을 늘려 ‘외계어’로 쓴 한글 문장을 인식하는 모습을 시연해 충격을 준 오픈AI-o1이 대표 사례다. 앤스로픽 또한 10월에 PC 화면을 인식해 자동 작업이 가능한 AI 에이전트를 공개했다. 구글은 워크스페이스·지도 등 자사 서비스에 제미나이를 이식하며 사용성 개선에 집중하고 있다.
더 많은 연산 자원 투입과 모델 대형화를 통한 성능 개선에 집중하던 AI 개발사들이 우회로를 찾고 있다는 분석이 잇따르는 배경이다. AI 인프라 투자 비용이 폭증하는 상황에서 시간이 갈수록 효율이 떨어지는 규모의 법칙에 매달리기보다는 고객 친화적인 서비스 개선을 통해 출구를 모색하고 있다는 해석이 나온다. 실제 노암 브라운 오픈AI 연구원은 10월 TED AI 콘퍼런스에서 “수천억, 수조 달러가 드는 모델을 훈련하는 건 재정적으로 불가능해 어느 순간 규모의 법칙이 무너질 수밖에 없다”고 인정해 업계에 충격을 안겼다.
더 나아가 학습할 데이터에 한계가 있다는 점도 걸림돌로 작용한다. 콘텐츠 저작권 소송이 이어지고 있는 데다 인터넷상에 공개된 데이터 대다수를 이미 학습해 ‘데이터 고갈’이 벌어지고 있다. 사정이 이렇게 되자 오픈AI와 구글은 최근 AI 훈련에 AI로 생성한 데이터를 활용하고 있다. 디인포메이션은 “구글이 제미나이 2.0 훈련 과정에서 생성 데이터를 사용했으나 이렇다 할 효과를 보지 못했다”고 지적했다.
추가 조사할 내용 및 요약
1. 클리카, “원천 기술로 만든 모델 경량화 AI, 전 세계서 쓰일 것”
링크 : https://www.donga.com/news/It/article/all/20241023/130278741/1+
IT동아는 서울경제진흥원(SBA)과 함께 ‘2024년 스케일업 프로그램’을 진행합니다. 서울창업허브 오픈이노베이션 참여기업 중 유망한 스타트업을 선정, 인터뷰로 발전사와 성과를 소개합니다. 나아가 이들이 다음 단계로 도약하도록 지원하는 프로그램입니다.
인공지능(이하 AI)이 주목받으면서 모델 경량화에 대한 시장의 관심도 뜨겁다. AI 장치는 메모리나 연산 장치 등으로 구성된 하드웨어 요소, 그리고 AI 모델 실행 데이터, 프로그램 등으로 구성된 소프트웨어로 나뉜다. 두 요소 모두 실행 요소나 작업 환경에 맞춰 그 수준과 성능이 결정되는데, 하드웨어가 크고 소프트웨어가 작은 건 큰 문제가 되지 않는다. 하지만 소프트웨어가 큰데 하드웨어가 작으면 제 성능을 낼 수 없다. 이 경우에는 성능은 최대한 유지하면서 소프트웨어 크기는 줄여서 넣어야 한다. 이 과정이 모델 경량화다.
업계에서는 모델 동작에 필요한 매개변수의 중요도를 조절하는 가중치, 함수 등을 낮은 비트의 정밀도로 조정하는 모델 양자화, 구성 요소를 간소화하는 가지치기, 작은 모델이 큰 모델과 유사한 성능이 내도록 하는 지식 증류 등 다양한 방법을 고안했다. 하지만 모델 크기를 줄여도 속도와 정확도는 유지해야 하는데, 수작업으로 이뤄져 둘 다 살리기가 쉽지 않다. 클리카는 자체 보유한 AI 엔진으로 모델 경량화를 자동화하고, 정확도와 속도 모두 잡아낸다.
“클리카 에이스, 모델 경량화의 연결고리”
클리카는 부부 사이인 김나율 대표와 벤 아사프 기술최고책임자(이하 CTO)가 공동 설립했다. 당시 벤 아사프 CTO는 모빌아이에 재직하며 사물인식 AI를 칩에 경량화해 탑재하는 작업을 했다. 자율주행이 크게 주목받던 시기여서 그가 잠깐 한국을 방문한 사이에도 많은 강연을 진행했고, 김나율 대표가 강연 준비를 도우며, AI의 시장 가능성을 내다보고 2021년 3월에 AI 경량화 기술로 창업을 시작했다.
창업 직후 벤 아사프 CTO는 이스라엘 히브리대 병렬컴퓨터 시니어 개발자로 일하며 모델 가속에 대한 연구를 시작했고, 6월부터 클리카 에이스의 기반이 되는 AI 경량화 엔진 개발에 착수한다. 벤 아사프가 서비스를 개발하는 사이, 마케팅 경력을 가진 김나율 대표는 시장 조사와 국내외 영업 기반, 지원사업 및 투자 등을 마련했다. 22년 들어 개발력을 가진 팀원들이 클리카에 합류했고, 본격적으로 클리카의 AI 기술력이 빛을 발하기 시작한다.
김나율 대표는 “모델 압축은 사이즈를 줄이는 방법, 하드웨어에 호환되도록 하는 방법 두 가지가 있다. 모델을 작게 한다고 무조건 좋은 건 아니고, 정확도와 속도 가속을 최대한 유지하는 게 이상적이다. 시중의 경량화 솔루션을 쓰면 모델 사이즈를 80% 정도 줄일 수 있지만, 엔비디아 계열만 주로 지원하거나 수작업이어서 시간이나 자금이 많이 든다”라고 배경을 설명했다.
“3년 경량화 실패한 작업, 클리카 에이스로 1달 만에 해결”
이어서 ”클리카는 이 부분을 AI로 완전히 자동화했다. 고객사로부터 어떻게 자동화하는지에 대한 요청이 많지만, 이 부분은 벤 아사프가 직접 고안한 아이디어를 엔진으로 구현한 것이어서 설명이 어렵다. 대신 다수의 레퍼런스를 통해 개발자 두 세명이 6개월에서 1년 정도 걸리는 작업을 5분 만에 해결할 수 있음을 보여줬다”라고 답했다.
도입 사례는 벤 아사프 CTO가 소개했다. 그는 “싱가포르는 정부 차원에서 AI 팀을 운영하는데, 오픈이노베이션 프로그램에 선정돼 정부 조직에서 시각 인식이나 오디오, 언어 모델 등을 경량화해서 배포하고 있다. 이외에도 국내외 빅테크 기업, 스마트 시티 등을 구축하는 해외 정부기관 등과도 유상 개념증명(PoC) 프로젝트를 진행 중이다”라고 덧붙였다.
(더 자세한 내용은 링크 참고)
2. ‘최적‧경량화 AI’ 특화된 ‘노타’···글로벌 협력 강화
링크 : https://www.sisajournal-e.com/news/articleView.html?idxno=405466
국내 인공지능 스타트업 ‘노타(Nota AI)’가 글로벌 시장에서 협력을 맺고 투자를 받는 등 성과를 냈다.
‘최적화‧경량화된 AI’ 기술을 무기로 내세우고 있는 노타는 최근 경직된 스타트업 투자 시장에서 지속적으로 투자 유치에 성공했고, 관련 기업들과의 협업을 확대하며 본격적인 글로벌 시장 진출에 속도 내고 있다.
2일 업계에 따르면, 노타는 지난 7월 300억원 규모의 시리즈C 투자를 유치했다. 노타의 누적 투자금은 532억원이다.
앞서 창업 초기 노타는 네이버 D2SF로부터 투자를 유치했고, 스톤브릿지벤처스, LB인베스트먼트 등으로부터 각각 4회, 3회 연속 투자를 받은 바 있다.
스틱벤처스, LB인베스트먼트가 주도한 이번 라운드도 스톤브릿지벤처스, 인터베스트, 디에스투자파트너스, KDB산업은행, 미래에셋증권과 주요 AI 반도체 CVC 등이 투자사로 참여했다.
벤처캐피탈업계 관계자는 “AI 산업에 대한 관심이나 수요가 높아졌고, 특히 경제적인 활용과 수익 측면에 주목하고 있는 분위기 속에서 노타의 솔루션은 경쟁력을 갖췄다는 평가가 나온다”며 “이에 투자와 함께 노타와의 협력을 원하는 글로벌 기업들이 증가하고 있는 것”이라고 말했다.
노타가 개발한 주력 모델인 ‘넷츠프레소는 디바이스에 AI모델을 최적화하는 플랫폼이다.
AI 모델 개발과정에서 덜 중요한 매개변수를 줄이거나 압축해 구형 AI 반도체에도 최신 기술을 활용하는 등 AI 모델 개발 환경을 제공한다.
넷츠프레소를 기반으로 개발된 노타ITS, 노타DMS 등 AI 솔루션은 교통 신호 제공, 실시간 사고 예측‧위험 상황 탐지, 운전자 상태‧부주의 운전 감지 등에 활용된다.
노타의 기술력은 글로벌 시장에서 인정 받아 넷츠프레소는 엔비디아, ARM, 르네사스 등 반도체 약 30개사 제품을 지원하고, AI 솔루션은 ‘엔비디아 GTC 2024’와 ‘임베디드 비전 서밋 2024’ 등에 선보이기도 했다.
노타는 AI 기술을 고도화하는 한편, 협업을 통한 글로벌 시장 진출도 본격화한다. 우선 노타는 글로벌 AI 반도체 기업들과의 협력을 강화해 ‘생성형 AI 분야 온디바이스 AI 선도 기업’이 되겠다는 목표를 세웠다.
이에 맞춰 넷츠프레소의 생성형 AI 기능을 업그레이드 하고 우수인재 채용에도 힘을 쏟고 있다.
노타는 네이버, SK텔레콤, LG전자 등 국내 주요 기업과의 협업 중이며 지난 5월 대만 어드밴텍과도 협력키로 다.
어드밴텍은 스마트 팩토리, 스마트 시티, 스마트 교통 등 다양한 산업 분야 솔루션을 제공하는 기업이다. 협약을 통해 양사는 고성능 AI 솔루션 개발‧수요 확대 등에 집중할 계획이다.
또 노타는 북미, 유럽 등 글로벌 시장을 중심으로 글로벌 AI 반도체 기업들과의 협력을 강화해 입지를 공고히 할 예정이다.
노타는 올해 매출을 전년 대비 300% 이상 증가할 것으로 전망하며 내년 초 상장에도 나선다.
채명수 노타 대표는 시리즈C 투자 유치 직후 “올 상반기 매출이 지난해 매출 총액을 상회할 전망”이라며 “파트너사들과의 협업과 해외 사업 확장을 통해 글로벌 시장에서 온디바이스 AI를 선도하는 기업으로 도약하겠다”고 밝혔다.
마무리
여기까지 오늘의 기사 스크랩이었습니다. 최근 AI 거품에 대한 우려가 증가하고 있고 이에 대한 많은 논의들이 이어지고 있습니다. 따라서 오늘은 이에 대한 기사를 살펴보고 AI 거품에 대한 우려가 AI 혁명에 대한 발전 지연에서 비롯되었다는 것을 알게 되었습니다. 이를 게선하기 위해 많은 기업은 거대화를 통한 성능 개선을 넘어, 경량화 그리고 자연스러운 대화 기능 그리고 추론과 서비스 세분화를 통해 분화하는 양상을 보인다는 것을 알게되었습니다. 이 중 경량화에 대해서 국내 스타트업 기업인 노타 AI와 클리카의 기사를 살펴보고 해당 기업들의 기술과 현황을 알 수 있었습니다.
'Scrapbook > News Scrap' 카테고리의 다른 글
[기사 스크랩] 2025년 인공지능은?..."AI 에이젠트가 주도하는 세상 속으로..." (0) | 2024.11.26 |
---|---|
[기사 스크랩] “크고 비싼 LLM 대신 가성비 높은 sLLM”... 빅테크 개발 전쟁에 韓 기업들도 동참 (0) | 2024.11.25 |
[기사 스크랩] SKT-삼성전자, AI로 5G 기지국 품질 최적화 나선다 (0) | 2024.11.23 |
[기사 스크랩] SKB, ‘AI로 만든 읽어주는 동화’ 선보여 (0) | 2024.11.22 |
[기사 스크랩] SK하이닉스가 AI 시대 주역으로 떠오른 배경 (0) | 2024.11.21 |