AI 뉴스
- 기사 제목 : 챗GPT 근간 ‘LLM’ 시대 갔나 새로 뜨는 ‘LAM’이 뭐기에
- 기사 링크 : https://www.mk.co.kr/news/business/11087510
본문 및 헤드라인
한 인터뷰가 인공지능(AI) 업계에 파장을 불러왔다. 주인공은 바로 세계 4대 인공지능 학자로 꼽히는 얀 르쿤 메타 AI최고과학자. 그는 5월 23일 파이낸셜타임스와의 인터뷰에서 “챗GPT와 같은 생성형 AI 제품을 구동하는 대규모 언어 모델(LLM)은 인간처럼 사고하고 계획하는 능력을 절대 갖추지 못할 것”이라고 지적했다.
LLM은 AI 대유행을 불러온 오픈AI ‘챗GPT’와 같은 생성형 AI 서비스의 근간이다. 최근 테크업계에서는 LLM의 한계론이 제기되고 있다. 생성형 AI가 인간과 유사한 포괄적인 지능으로 쉽게 통합될 수 있을지에 의구심을 표하는 관점에서다. 얀 르쿤 박사의 인터뷰가 이러한 논의에 불을 지핀 셈이다. 실제로 최근 빅테크 회사와 차세대 AI 유니콘을 중심으로 LLM의 한계를 극복하는 새로운 형태의 AI 모델 개발 또한 이뤄지고 있다.
LLM은 단어나 문장이 복잡하게 배열되어 있을 때, 문장의 구성이 통계적으로 가장 일반적으로 쓰이는 형태를 취하도록 학습된 ‘언어 모델’을 수억 개에서 수천억 개 단위로 모아놓은 구조로 설계됐다. 업계에서는 생성형 AI가 이 같은 LLM을 기반으로 학습·훈련하기 때문에 피상적이고 제한적이며, 인간처럼 추론하고 계획하는 능력을 달성하지 못할 것이라는 지적이 나오고 있다.
르쿤 박사가 LLM이 초지능으로 발전할 수 없다고 강조한 이유도 이와 일맥상통한다. 그가 지적한 LLM의 한계는 물리적 세계에 대한 이해 부족이다. 르쿤 박사는 “LLM은 논리에 대한 매우 제한된 이해를 가지고 있으며, 물리적 세계를 이해하지 못하고, 지속적인 기억을 가지지 않으며, 어떤 합리적인 정의로도 추론할 수 없고, 계층적으로 계획을 세울 수 없다”고 말했다. 인간은 관찰을 통해 공이 떨어지면 튀어 오를 것을 당연히 알지만, LLM은 이러한 단순한 것조차 알 수 없다는 설명이다. 르쿤 박사는 “이러한 모델은 올바른 훈련 데이터를 입력 받아야만 정확한 답변을 제공할 수 있기 때문에 본질적으로 안전하지 않다”고 주장했다.
LLM의 한계론이 의미가 있는 까닭은 AI 발전에 대한 기대감 때문이다. 이른바 인공일반지능(AGI)이다.
최근 테크업계에서는 LLM에 대한 대안으로 LAM(대형액션모델) 개발에 주목하는 움직임이 포착된다. LAM은 운영체제(OS)로 작동하기 위한 ‘AI 에이전트’ 상용화에 포커스를 맞추고 있다. 예컨대 영화 ‘아이언맨’ 시리즈에서 토니 스타크를 보조하는 인공지능(AI) ‘자비스’가 그 예시다. 자비스는 집 안 모든 전자 디바이스를 연결한다. 또 자비스는 자신을 만든 주인공 토니 스타크의 명령에 따라 움직이지만 스스로 판단하고 분석할 줄 아는 능력을 갖추고 있다.
머지않아 자비스처럼 우리의 명령을 수행하고 일부 영역에서는 판단까지 대신해줄 수 있는 AI가 하나의 통합된 운영체제 형태로 나타날 수 있다는 분석이다. 현재 우리가 사용하는 디바이스(데스크톱, 스마트폰, 스마트카 등)는 대부분 다른 OS 위에서 구동되고 있다. 이를 하나의 AI로 통합하면 인간이 번거롭게 디바이스를 만질 필요조차 없어진다.
이와 같은 문제의식에서 최근 기존 LLM과 차별화하는 대형액션모델(LAM)을 개발하는 회사들이 생겨나고 있다. LLM이 사용자 프롬프트를 해석하고 텍스트 기반 응답을 생성하는 데 그친다면, LAM은 AI 기능을 언어 이상으로 확장한다는 아이디어다. 인간 수준의 텍스트를 생성하고, 번역에도 능통하며, 마치 사람처럼 답변하는 기능을 탑재해 AI 열풍을 가져온 LLM의 진화 버전인 셈이다. 특히 LAM은 다양한 애플리케이션, 외부 시스템과의 통합을 통해 현실 세계와 상호작용을 목표로 한다. LAM 기술 개발에 성공한다면, LLM을 개선해 ‘AI 에이전트’ 시대를 열 수 있는 단초를 제공할 것으로 기대된다. 에이전트는 스스로 작업을 실행할 수 있는 소프트웨어 단위를 의미한다. 단순히 사람의 질문에 대답하는 대신 궁극적인 목표 달성을 돕는 개념이다. 단지 한 번에 하나씩 프롬프트에 반응하는 것이 아니라 여러 단계로 작업을 세분화하고 하위 작업을 수행할 수 있도록 설계된다.
LLM은 말 그대로 방대한 양의 데이터를 기반으로 훈련된다. LLM은 텍스트 정보 교환으로 제한된 가상 영역 내에서 운영되기 때문에 실제 세계와의 상호 작용에서 한계점을 보인다. 또한 사용자의 지시(프롬프트)를 해석하고 이를 기반으로 한 응답을 생성하는 데 탁월하다. 하지만 사람을 완전히 대체하는 ‘AI 에이전트’ 수준까지 도달하기엔 어려움이 많다는 설명이다.
반면 LAM은 다양한 애플리케이션, 실제 시스템과의 상호작용을 핵심적인 ‘해결 과제’로 삼는다. 예컨대, LLM 기반 서비스들이 사용자의 지시에 따라 이메일 초안을 작성한다면 LAM 기반 서비스들은 이메일을 누구한테 언제 전달할지까지 관리할 수 있다는 아이디어다. 쉽게 말해 LAM 기반 AI는 내 스마트폰에 접속해 인간 대신 모든 일을 해줄 수 있다. 현재 LAM의 기술적 기반은 ‘신경 기호 프로그래밍’ 혹은 ‘순환신경망(RNN)’이다. RNN은 먼저 나온 데이터를 바탕으로 뒤에 나올 정보를 추론하는 데 최적화된 AI 알고리즘을 의미한다. 단순한 모델이 아니라 AI 시스템을 컴퓨터 애플리케이션과 통합한다는 것이 기술적 목표다. 오로지 데이터에만 의존하는 기존 AI 모델과 달리 신경망, LAM은 신경 기호 프로그래밍을 결합한 하이브리드 접근 방식을 활용하여 광범위한 작업을 처리할 수 있다는 설명이다.
추가 조사할 내용
1. LAM 사례
링크 : https://www.lgcns.com/blog/it-trend/52597/
LLM과 LAM이 결합될 경우 인간의 행동을 대신할 AI 에이전트가 탄생할 수 있습니다. 일례로, 마케팅 분야에서 LLM이 카피 작성, 이미지 생성, 웹 레이아웃 생성 등의 역할을 하면, LAM은 이 과정을 자동화할 수 있습니다. 즉, 음성이나 문자 입력만으로 AI가 마케팅 자료, 고객 데이터, LLM 등에 접근해 이를 직접 다루는 게 가능해지는 것입니다. LAM의 특징은 크게 세 가지입니다.
1. 고급 데이터 처리: LAM은 방대한 데이터 세트를 처리하고 분석할 수 있습니다. 광범위한 데이터 해석이 필요한 애플리케이션에 효과적입니다.
2. 효율적인 의사 결정: LAM은 정교한 알고리즘을 통해 의사 결정 과정을 자동화합니다. AI 시스템이 더 복잡한 작업을 효과적으로 실행할 수 있도록 지원합니다.
3. 확장성과 유연성: LAM은 확장성이 매우 뛰어납니다. 간단한 자동화부터 복잡한 문제 해결까지 다양한 앱에 적용할 수 있습니다.
이와 같은 특징을 가진 LAM을 챗봇에 접목한다면 어떻게 될까요? 현재 자동차 판매 사이트에 부착된 AI 챗봇은 학습한 데이터를 기반으로 사용자 질문에 답변하지만, LAM을 결합한 챗봇은 소비자가 원하는 차량을 판별해 예약 주문까지 수행합니다. 즉, 개인화가 가능해지는 건데요. 사용자의 인터넷 활용 패턴을 학습해 일상 업무를 자동화할 수도 있습니다. LLM이 은행 대출 초안을 작성했다면, LAM은 은행에 대출 서류를 발송하는 일까지 대신하게 되는 것이죠.
LAM 기술은 휴먼 컴퓨터 인터페이스(HCI, Human Computer Interface, 사람의 음성, 뇌파, 근육, 동작 등을 기계가 인식하는 것) 영역을 크게 뒤바꿀 것으로 보입니다. 지금까지 컴퓨터와의 상호작용은 그래픽 유저 인터페이스(GUI, Graphical User Interface, 사용자가 컴퓨터와 정보를 쉽게 교환하고 상호 작용하기 위해 아이콘 등과 같은 그래픽을 이용한 사용자 인터페이스)를 통해 이뤄졌는데요. 버튼의 위치, 하위 레이어의 위치 등을 알고, 이를 작동하기 위해 직접 사람이 움직여야 했습니다. LAM과같이 복잡한 소프트웨어는 시간을 들여 학습해야 하기 때문에 초기에는 오히려 구식으로 느껴질 수 있습니다. 하지만 앞으로의 LAM 기술은 초보자도 전문 지식 없이 자유자재로 사용할 수 있고, 고령자나 장애인도 디지털 장벽 없이 소프트웨어를 작동할 수 있도록 만들 것입니다. LAM이 AI 에이전트의 서막이라고 불리는 이유입니다.
2. LLM vs LAM
3. AX 경영
링크 : https://www.mk.co.kr/news/economy/11117360
LLM 넘어 LAM 뜬다
AI 장착한 하드웨어…제조업 이끌 것
이번 콘퍼런스에서는 AI 분야 현업 관계자와 전문가 20여명이 연사로 나와 AX 혁신에 대한 심도 있는 논의를 진행했다. 실리콘밸리를 중심으로 AI 분야에 전문 투자하는 벤처캐피털(VC) 스트랫마인즈를 이끄는 리처드 장 대표는 “어떤 기업도 AX 없이 다음 단계를 논하거나 혁신을 기대할 수 없는 상황”이라고 강조했다. 양자 컴퓨터, 블록체인 등 최근 동시다발적으로 일어나고 있는 모든 기술 혁신을 주도하는 주체가 바로 AI기 때문이다. 리처드 장 대표는 “개발자 30명으로 이뤄진 팀이 3일 밤을 새며 만든 코드를 AI는 2시간 동안 100만개 만들어낸 사례도 있다”며 “AX 혁신 여부에 따라 선진국과 후진국 격차 정도가 아닌 ‘문명급 차이’가 벌어질 수 있다”고 말했다.
AX가 성공적으로 진행 중인 여러 사례 발표도 이어졌다.
권한슬 스튜디오프리윌루전 대표는 콘텐츠 시장에서 어떤 식으로 AX 혁신이 일어나고 있는지 분위기를 들려줬다. 스튜디오프리윌루전은 100% AI 기술로 만든 영상으로 최근 열렸던 ‘제1회 두바이 국제 AI 영화제’에서 대상과 관객상을 수상하며 2관왕을 거머쥐었다. 실사 촬영과 CG 작업 없이, 텍스트 입력만으로 AI가 만든 영화 ‘원 모어 펌킨’이 수상작이다.
매출도 일어난다. 광고나 영화 등 큰 비용이 드는 영상을 본격적으로 만들기 전, 간단히 시각화된 콘텐츠를 제작하는 ‘프리비즈(Pre-Visual)’ 시장에 주목하면서다. 권한슬 대표는 “영화·드라마 등 콘텐츠 제작비가 워낙 높아지면서 투자 리스크도 그만큼 커진 상황이다. 투자자는 AI가 빠르게 제작한 데모 영상으로 사전에 콘텐츠 경쟁력을 확인할 수 있다”며 “다소 품질이 떨어지더라도 굉장히 저렴하고 빠르게 영상을 구현할 수 있다는 게 AI의 장점”이라고 설명했다.
콘텐츠 시장뿐 아니다. 이미 반도체·통신·금융 등 전통 산업에서 AX 혁명이 진행 중이다. 선박을 설계하고 장비 고장을 예측하는 AI, 소비자 문의 즉시 금융상품을 파악해 알려주는 AI 콜센터 ‘AICC’, 계약서에 독소 조항이나 사실과 다르게 명시된 부분을 즉각 알려주는 ‘법률 AI’ 등이 대표적이다. 김동환 포티투마루 대표는 “특정 산업에 특화된 AI 중심으로 기술이 발달하면서 기존 AI가 갖고 있던 문제점이 해결되고 있다. 사실이나 전체 맥락과 다른 결괏값을 내놓는 ‘환각’을 비롯해 보안과 비용 문제가 해소됐다”고 설명했다.
로봇과 AI 결합을 일컫는 ‘임베디드 AI’에 대한 관심도 뜨거웠다. 임베디드 AI란, AI에 보고 듣고 움직일 수 있는 ‘신체’를 달아주는 기술을 말한다. ‘로봇과 AI의 결합’이라고 보면 쉽다. 챗GPT같이 언어를 기반으로 한 LLM(Large Language Model)을 넘어 실제 물리 세계에까지 영향을 끼치는 LAM(Large Action Model)으로의 진화다. 로봇을 매개로 AI가 현실 세계를 학습하고 직접 행동에 나서는 방식이다.
‘로봇에 AI를 입히다’라는 주제로 강연에 나선 이상민 뉴빌리티 대표는 AI 기술 발전에 맞춰 진화하는 로봇 기술을 설명했다. 이상민 대표는 “AI가 인간과 동일한 지능을 보유한 AGI로 점차 진화하면서 로봇 기술 트렌드도 바뀌었다. 단순 산업용 로봇을 넘어 서비스 로봇, 나아가 범용 휴머노이드 수요가 커지고 있다”며 “LAM 모델은 앞으로 GPT보다 일상 속에 훨씬 더 빨리 침투할 수 있는 잠재력을 갖고 있다”고 말했다.
마무리
여기까지 오늘의 기사 스크랩이었습니다. 오늘은 LLM의 발전 방향 중 하나인 LAM에 대해서 알아보는 시간을 가졌습니다. LLM, LMM, LWM, sLLM 그리고 LAM에 이르기까지 우리가 사용하는 거대 언어는 참 많은 방향으로 발전이 이루어지고 있는 것 같습니다. 그러면서 기존 LLM과 LAM의 차이를 살펴보고 그에 대한 사례 그리고 국내에서는 이에 대해서 어떠한 지침을 가지고 있는 지 등을 살펴보았습니다. 다가오는 로봇 시대에 필수적인 LAM은 어떻게 발전하며 앞으로 어떤 기술을 선보일지를 기대하며, 이번 글은 여기서 마치도록 하겠습니다.
'Scrapbook > News Scrap' 카테고리의 다른 글
[기사 스크랩] 새로운 지능의 시대: 검색증강생성(RAG)에서 인공일반지능(AGI)까지 (0) | 2024.11.17 |
---|---|
[기사 스크랩] 데이터 주권 강조하는 소버린 AI, 진정한 의미는? (0) | 2024.11.16 |
[기사 스크랩] 이스트소프트, 음성·입모양도 다국어로 변환하는 ‘AI 비디오 트랜슬레이터’ 출시 (0) | 2024.11.14 |
[기사 스크랩] 온디바이스 AI 기술 발전과 확산에 따른 대처 방안 (0) | 2024.11.13 |
[기사 스크랩] 네이버, 2025년 ‘AI 서비스’ 본격 적용 선언...“전 서비스에 AI 녹여내는 것이 목표” (0) | 2024.11.12 |