AI 뉴스
기사 제목 : AI를 '사라지게' 할 AI 기술, 에이전트와 온디바이스
기사 링크 : https://www.aitimes.com/news/articleView.html?idxno=156057
본문 및 헤드라인
이번 주 AI타임스에서 가장 많이 읽힌 기사는 '2024년부터 '인공지능'이라는 말이 사라지기 시작할 것'이었습니다. 인공지능(AI)이 광범위하게 배포되고 일상에 녹아들며, 굳이 AI라는 것을 강조할 필요도 인식할 필요도 없이 자연스럽게 UI나 UX처럼 자리 잡을 것이라는 내용으로, 많은 사람들이 공감을 표시했습니다.
사실 올 초부터 전문가들은 비슷한 예측을 내놓았습니다. 그리고 이는 막연한 희망 사항이 아닌, 기술적인 근거가 몇가지 있습니다. 바로 'AI 에이전트'와 '온디바이스 AI'입니다.
AI 에이전트는 대형언어모델(LLM)이나 챗봇을 개발하는 모든 업체들의 공통적인 목표입니다. 사용자가 원하는 것을 AI가 알아서 해주는, 즉 'AI 비서'를 말합니다.
마이크로소프트(MS)가 내년 출시할 윈도우 12의 '코파일럿'이 본격적인 시작이 될 것으로 보입니다. 예를 들어 온라인으로 무언가를 구매하려면 이제까지는 PC를 켜고 웹 브라우저를 열고 상품을 검색한 뒤 결제를 직접 진행하는 식이었으나, 앞으로는 PC를 켠 뒤 등장하는 코파일럿에 말로 이런 내용을 지시하면 알아서 결제까지 다 처리해 준다는 내용입니다.
빌 게이츠 MS 창립자도 AI 에이전트가 5년 내 컴퓨팅 방식을 완전히 바꿀 것이며, 비즈니스 방식과 사회상까지 혁신할 것이라고 예고했습니다.
여기에는 중요한 기술적인 문제가 하나 있습니다. 전 세계 수십억명이 동시에 인터넷에 접속, AI 에이전트를 사용하는 것은 현실적으로 불가능합니다. LLM을 가동하려면 엄청난 컴퓨팅 리소스가 필요하기 때문입니다. 그래서 펫 겔싱어 인텔 CEO는 "생성 AI를 현실화하는 것은 온디바이스 AI뿐"이라고 지적했습니다.
온디바이스 AI는 휴대폰이나 노트북에 AI 모델을 탑재한 NPU(신경망 칩)를 설치, 인터넷 연결 없이 기기 안에서 생성 AI를 구동하는 기술입니다. 실제로 인텔과 퀄컴은 최근 이를 직접 시연했으며, 애플이나 삼성전자는 제품 판매에 들어갔습니다.
특히 그동안 잠잠하던 애플도 온디바이스 AI에 올인하고 있습니다. 관련 기술을 쏟아내기 시작했습니다.
결국 AI 에이전트를 가능하게 하는 것은 휴대폰이나 노트북과 같은 '장치'입니다. 최근에는 AI 비서를 탑재한 웨어러블 기기도 속속 등장하고 있습니다. 메타가 내놓은 안경이나 옷에 부착하는 전용 기기는 이미 출시 중입니다.
그리고 이런 대부분 사실은 최근 2~3개월 안에 벌어진 일이라 놀랍습니다. 올 여름만 해도 이런 상황이 일어날 것이라고 대부분은 짐작도 하지 못했다는 말입니다.
AI의 발전은 그야말로 '빛의 속도'로 이뤄지고 있습니다. '챗GPT' 등장 1년 만에 우리는 SF가 현실이 되는 장면을 목격하고 있습니다.
이어 국내외 주요 이슈입니다.
■ 구글 "인간이 가르쳐주지 않은 새로운 답까지 LLM이 생성"
구글 딥마인드가 LLM이 내놓는 답 중 가치 있는 것을 가려내고 이를 통해 답을 고도화하는 과정에서, 인간이 미처 발견하지 못한 새로운 지식을 찾아냈다고 발표했습니다. 이를 통해 까다로운 수학 문제를 풀어냈는데, '획기적인 발견'이라는 설명입니다.
■ 오픈AI, AGI 제어 접근 방식 공개…”저지능으로 초지능 제어”
오픈AI가 인간이 원하는 작업을 AI가 수행하게 만들고, 원하지 않는 작업을 수행하지 않도록 하는 '정렬' 기술의 프레임워크를 공개했습니다. 'GPT-2'로 훨씬 뛰어난 'GPT-4'를 감독하는 것과 같은 원리입니다.
■ AI가 AI 만드는 시대..."대형 모델 자기 복제로 엣지 AI 생성"
대형 AI 모델이 자기 복제를 통해 소형 '엣지 AI'를 개발하도록 하는 기술이 등장했습니다. 영화 '터미네이터'에서 스카이넷이 킬러 로봇을 생산하는 장면을 떠오르게 합니다.
■ "AI, 운동 능력도 인간 능가"...물리적 컨트롤 필요한 게임서 신기록
정확한 물리적 컨트롤이 필요한 보드게임에서 인간을 능가하는 AI가 등장했습니다. 지적인 능력은 물론 운동능력까지 AI가 앞서는 시대로 접어들었습니다.
■ "LLM으로 사람의 미래까지 예측 가능"...덴마크공대, 미래 생성하는 모델 개발
덴마크공대 등 연구진이 언어를 생성하는 LMM에 인간에 대한 다양한 데이터를 학습, 미래에 일어날 일을 출력하게 하는 데 성공했습니다. 이 모델은 기존 사회과학 등에서 사용하는 방법과 똑같은 예측을 내놓았다고 합니다.
■ MS, '애저 AI 스튜디오' 대폭 확장...오픈 소스 LLM 40개 추가
MS가 ‘라마 2’나 '미스트랄 7B’ 등 인기 있는 오픈 소스 모델 40개를 클라우드 서비스에 추가했습니다. 오픈AI 의존도를 줄이고, 기업이 다양한 모델을 골라서 사용하게 하자는 의도입니다.
■ 구글 제미나이, 첫 외부 테스트서 'GPT-3.5 터보'보다 성능 떨어져
최강 성능이라고 구글이 자랑했던 '제미나이'가 기대에 못 미치는 것으로 나타났습니다. 정식 공개 후 첫 외부 테스트에서 '제미나이 프로'는 'GPT-3.5 터보'보다 성능이 떨어졌습니다.
■ 뤼튼 “내년부터 AI 메가 플랫폼 본격 시동"
국내 생성 AI 대표 스타트업 뤼튼이 내년 계획을 발표했습니다. 브랜드를 전면 리뉴얼하고 기술을 고도화, 내년까지 500만명 이상의 월 활성 사용자를 확보하는 게 목표입니다.
추가 조사할 내용 및 요약
1. AI 에이전트
링크 : https://aws.amazon.com/ko/what-is/ai-agents/
AI 에이전트란 무엇일까요?
인공 지능 에이전트는 환경과 상호 작용하고, 데이터를 수집하고, 데이터를 사용하여 사전 결정된 목표를 달성하기 위해 필요한 작업을 스스로 결정해서 수행할 수 있는 소프트웨어 프로그램입니다. 사람이 목표를 설정하면 AI 에이전트는 목표를 달성하기 위해 필요한 최적의 조치를 독립적으로 선택합니다. 예를 들어 고객 문의를 해결해야 하는 상담 센터 AI 상담원을 생각해 보세요. 상담원은 자동으로 고객에게 여러 질문을 하고, 내부 문서의 정보를 조회하고, 해결책을 찾아 대응합니다. 고객의 대답에 따라 고객 문의 자체를 해결할 수 있는지 아니면 사람에게 전달해야 하는지 결정합니다.
AI 에이전트를 정의하는 주요 원칙은 무엇인가요?
모든 소프트웨어는 소프트웨어 개발자가 결정한 다양한 작업을 자율적으로 완료합니다. 그렇다면 AI 또는 지능형 에이전트가 특별한 이유는 무엇일까요?
AI 에이전트는 합리적인 에이전트입니다. AI 에이전트는 자신이 인지한 내용과 데이터를 기반으로 합리적인 결정을 내려 최적의 성과와 결과를 도출합니다. AI 에이전트는 물리적 또는 소프트웨어 인터페이스로 환경을 감지합니다.
예를 들어 로봇 에이전트가 센서 데이터를 수집하고, 챗봇은 고객 쿼리를 입력으로 사용합니다. 그 후 AI 에이전트가 이러한 데이터를 적용하여 정보에 입각한 결정을 내립니다. AI 에이전트는 수집된 데이터를 분석하여 사전 결정된 목표를 뒷받침하는 최상의 결과를 예측합니다. 또한 AI 에이전트는 결과를 사용하여 필요한 다음 조치를 구합니다. 예를 들어 자율 주행 자동차는 여러 센서의 데이터를 기반으로 도로 위의 장애물을 피합니다.
AI 에이전트를 사용하면 어떤 이점이 있나요?
AI 에이전트는 비즈니스 운영과 고객 경험을 개선할 수 있습니다.
생산성 향상
AI 에이전트는 사람의 개입 없이 특정 작업을 수행하는 자율 지능형 시스템입니다. 조직에서는 AI 에이전트를 사용하여 특정 목표와 보다 효율적인 비즈니스 성과를 달성합니다. 비즈니스 팀은 반복 작업을 AI 에이전트에게 위임할 때 생산성이 향상됩니다. 이렇게 하면 업무에 중요한 활동이나 창의적인 활동에 집중하여 조직에 더 많은 가치를 더할 수 있습니다.
비용 절감
기업에서는 지능형 에이전트를 사용하여 프로세스 비효율성, 사람의 오류 및 수동 프로세스로 인해 발생하는 불필요한 비용을 줄일 수 있습니다. 자율 에이전트는 변화하는 환경에 적응하는 일관된 모델을 따르기 때문에 복잡한 작업을 자신 있게 수행할 수 있습니다.
정보에 입각한 의사 결정
고급 지능형 에이전트는 기계 학습(ML)을 사용하여 대량의 실시간 데이터를 수집하고 처리합니다. 따라서 비즈니스 관리자는 다음 단계에 대한 전략을 수립할 때 빠른 속도로 보다 정확하게 예측할 수 있습니다. 예를 들어 광고 캠페인을 실행할 때 AI 에이전트를 사용하여 다양한 시장 세그먼트의 제품 수요를 분석할 수 있습니다.
고객 경험 개선
고객은 기업과 상호 작용할 때 매력적이고 개인화된 경험을 기대합니다. AI 에이전트를 통합하면 기업은 추천 제품을 개인화하고, 즉시 대응하며, 혁신을 통해 고객 참여, 전환율 및 충성도를 높일 수 있습니다.
AI 에이전트 아키텍처의 주요 구성 요소는 무엇인가요?
인공 지능 분야의 에이전트는 고유의 목적을 달성하기 위해 다양한 환경에서 작동할 수 있습니다. 그러나 모든 기능성 에이전트는 다음과 같은 구성 요소를 공유합니다.
아키텍처
아키텍처는 에이전트가 작동하는 기반입니다. 아키텍처는 물리적 구조일 수도 있고, 소프트웨어 프로그램일 수도 있고, 둘의 조합일 수도 있습니다. 예를 들어 로봇 AI 에이전트는 액추에이터, 센서, 모터 및 로봇 팔로 구성됩니다. 한편 AI 소프트웨어 에이전트를 호스트하는 아키텍처는 텍스트 프롬프트, API 및 데이터베이스를 사용하여 자율 운영을 가능하게 할 수 있습니다.
에이전트 기능
에이전트 기능은 수집된 데이터가 에이전트의 목표를 지원하는 작업으로 변환되는 방법을 설명합니다. 에이전트 기능을 설계할 때 개발자는 정보 유형, AI 기능, 기술 자료, 피드백 메커니즘 및 기타 필요한 기술을 고려합니다.
에이전트 프로그램
에이전트 프로그램은 에이전트 기능을 구현한 것입니다. 여기에는 지정된 아키텍처에서 AI 에이전트를 개발, 학습 및 배포하는 작업이 포함됩니다. 에이전트 프로그램은 에이전트의 비즈니스 로직, 기술 요구 사항 및 성능 요소를 조정합니다.
AI 에이전트는 어떻게 작동하나요?
AI 에이전트는 복잡한 작업을 단순화하고 자동화하는 방식으로 작동합니다. 대부분의 자율 에이전트는 할당된 작업을 수행할 때 특정 워크플로를 따릅니다.
목표 결정
AI 에이전트는 사용자로부터 구체적인 명령 또는 목표를 받습니다. 이 에이전트는 이 목표를 사용하여 사용자와 관련이 있고 사용자에게 유용한 최종 결과를 만들어 내는 작업을 계획합니다. 그 후 목표를 여러 개의 실행 가능한 작은 작업으로 나눕니다. 목표를 달성하기 위해 이 에이전트는 특정 순서 또는 조건에 따라 이러한 작업을 수행합니다.
정보 획득
AI 에이전트가 계획한 작업을 성공적으로 수행하려면 정보가 필요합니다. 예를 들어 AI 에이전트는 대화 로그를 추출하여 고객 감정을 분석해야 합니다. 따라서 AI 에이전트는 인터넷에 액세스하여 필요한 정보를 검색하고 찾아야 합니다. 일부 애플리케이션에서는 지능형 에이전트가 다른 에이전트 또는 기계 학습 모델과 상호 작용하여 정보에 액세스하거나 정보를 교환할 수 있습니다.
작업 구현
충분한 데이터가 있으면 AI 에이전트는 당면한 작업을 체계적으로 구현합니다. 에이전트는 작업을 마치면 목록에서 해당 작업을 제거하고 다음 작업을 진행합니다. 작업 완료 사이에 에이전트는 외부 피드백을 받고 자체 로그를 검사하여 목표를 달성했는지 평가합니다. 이 프로세스 동안 에이전트가 최종 결과에 도달하기 위해 더 많은 작업을 생성하고 실행할 수도 있습니다.
2. 온디바이스 AI
링크 : https://semiconductor.samsung.com/kr/solutions/technology/on-device-ai/
'온디바이스 AI'란 서버나 클라우드에 연결할 필요 없이 모바일 기기 자체적으로 정보를 처리할 수 있다는 것을 의미합니다. 온디바이스 AI는 저지연, 향상된 보안, 유연성 등 다양한 이점을 가지고 있으며, 디바이스가 네트워크에 연결되어 있지 않을 때도 언제든지 사용할 수 있습니다. 이 기술을 완벽하게 구현하려면 강력한 신경망 처리 장치(NPU) 성능이 필수적입니다.
온디바이스 AI의 무한한 가능성
온디바이스 AI는 사진이나 동영상의 화질을 개선하고 고품질의 콘텐츠 인식 프로세싱을 지원하는 등 점점 더 많은 기능을 제공하고 있습니다. 최근에는 대규모비전모델(LVM) 및 대규모언어모델(LLM)과 같은 복잡한 수준의 생성형 인공지능도 경량화되어, 클라우드로 전송할 필요 없이 에지 디바이스에서 즉시 처리할 수 있도록 발전하고 있습니다. 고성능 NPU는 이러한 기능을 수행하는 데 필요한 복잡한 수준의 연산을 디바이스 내에서 빠르게 처리합니다.
인공지능(AI) 기술은 모바일 등 스마트기기에서 수집한 정보를 중앙 클라우드 서버로 전송해 분석하고 다시 기기에 보내는 방식으로 진행되어 왔습니다. 이와 달리 온디바이스(On-device) AI는 이름 그대로 멀리 떨어진 클라우드 서버를 거치지 않고 스마트기기 자체적으로 정보를 수집하고 연산할 수 있는데요.
이렇듯 온디바이스 AI는 단말 기기 내부에서 정보를 처리하기 때문에 저지연을 통한 빠른 작업이 가능해집니다. 중앙 서버를 통하지 않기 때문에 클라우드 기반 AI의 문제점으로 대두되었던 보안 문제도 해결할 수 있는데요. 또한 별도의 네트워크가 필요 없기 때문에 인터넷 연결이 어려운 상황에서도 실시간 번역과 같은 작업이 가능합니다.
기존에는 클라우드 서버가 정보를 처리하는 뇌라면 휴대폰이나 태블릿 PC 등은 사용자와 접점을 이뤄 정보를 수집하는 눈과 귀와 같은 역할을 담당해왔습니다. 하지만 이러한 처리 방식은 멀리 떨어져 있는 인공지능이 실제 정보가 발생하고 있는 현장을 본질적으로 이해하기는 어렵다는 한계가 있었는데요.
그러나 사용자와 직접 접촉하는 하드웨어인 엣지 디바이스에 AI가 결부된 형태의 온디바이스 AI는 환경을 직접 경험하고 정보를 처리하기 때문에 실제 사용하는 사람에게 더욱 적합한 결정을 내릴 수 있다는 장점이 있습니다.
온디바이스 AI가 가져올 삶의 변화
삼성전자는 딥러닝(Deep Learning) 알고리즘과 온디바이스 AI와 같은 혁신기술 연구에 집중하고 있습니다. 지난 11월에 진행된 ‘삼성 AI포럼 2019’를 통해 서버를 거치지 않고 기기 자체에서 AI 기능을 수행하는 ‘온디바이스 AI 통역 기술’을 선보이기도 했는데요.
삼성전자의 프리미엄 모바일 어플리케이션 프로세서(AP) 엑시노스 9(9820)가 대표적인 온디바이스 AI의 예시라고 할 수 있습니다. 지연 없이 실시간으로 다양한 연산을 처리하는 시스템 반도체 신경망처리장치(NPU, Neural Processing Unit) 탑재로 모바일 기기 자체에서 기존 대비 7배 빠른 인공지능 연산 처리가 가능해졌는데요. 고성능 연산 능력이 필요한 온디바이스 AI를 위해 NPU 성능을 높이기 위한 삼성전자의 노력은 계속될 예정입니다.
온디바이스 AI의 발전을 통해 사용자의 식습관이나 운동 등 생활 습관에 대한 정보를 직접적으로 파악할 수 있게 되면서 스마트 기기의 사용자 맞춤형 서비스도 더욱 강화될 전망인데요. 사용자 중심의 온디바이스 AI의 활성화가 우리의 실제 생활에 미칠 긍정적인 변화를 기대해 봅니다
3. NPU
링크 : https://www.aitimes.kr/news/articleView.html?idxno=30227
생성 인공지능(Generative AI) 혁명이 시작되었다. 다양한 요구사항과 컴퓨팅 수요가 있는 다양한 업종에서 생성 AI에 대한 수요가 증가함에 따라 AI를 위해 맞춤 설계된 새로운 컴퓨팅 아키텍처에 대한 필요성이 분명해졌다.
이 아키텍처는 처음부터 생성 AI를 위해 설계된 신경처리장치(Neural Processing Unit, NPU)로 시작하여 중앙처리장치(Central Processing Unit, CPU) 및 그래픽 처리 장치(Graphics Processing Unit, GPU)와 같은 이기종 프로세서의 조합을 활용한다. 이종 컴퓨팅은 NPU와 함께 적절한 프로세서를 사용함으로써 새롭고 향상된 생성 AI 경험을 가능하게 하는 애플리케이션 성능, 열 효율성 및 배터리 수명을 극대화한다.
이기종 컴퓨팅이 중요한 이유는 생성 AI의 다양한 요구사항과 연산 수요로 인해 다양한 프로세서가 필요하다. 처리 다양성을 갖춘 이기종 컴퓨팅 아키텍처는 각 프로세서의 강점, 즉 각기 다른 작업 영역에서 뛰어난 CPU 및 GPU와 함께 AI 중심의 맞춤형 설계된 NPU를 활용할 수 있는 기회를 제공한다. 예를 들어, 순차적 제어 및 즉시성을 위한 CPU, 병렬 데이터 스트리밍을 위한 GPU, 스칼라, 벡터 및 텐서 수학을 사용하는 핵심 AI 워크로드에 NPU를 사용할 수 있다. 이기종 컴퓨팅은 애플리케이션 성능, 디바이스 열 효율, 배터리 수명을 극대화하여 생성 AI 최종 사용자 경험을 극대화한다.
NPU란?
NPU는 처음부터 저전력으로 AI 추론을 가속화하기 위해 설계되었으며, 새로운 AI 알고리즘, 모델 및 사용 사례의 개발과 함께 아키텍처가 발전해 왔다. AI 워크로드는 주로 스칼라, 벡터, 텐서 수학으로 구성된 신경망 레이어와 비선형 활성화 함수를 계산하는 것으로 구성된다. 우수한 NPU 설계는 이러한 AI 워크로드를 처리하는 데 올바른 설계로 AI 산업의 방향과 긴밀히 연계되어 있다.
선도적인 NPU 및 이기종 컴퓨팅 솔루션
퀄컴(Qualcomm Technologies)은 모든 곳에서 인텔리전트 컴퓨팅을 구현하고 있다. 업계를 선도하는 퀄컴 헥사곤 NPU(Hexagon NPU)는 저전력으로 고성능 AI 추론을 지속할 수 있도록 설계되었다. 시스템 접근 방식, 맞춤형 설계, 빠른 혁신이 NPU의 차별화 요소다. NPU를 맞춤 설계하고 명령어 세트 아키텍처(ISA)를 제어함으로써 병목 현상을 해결하고 성능을 최적화하기 위해 설계를 빠르게 발전 및 확장할 수 있다.
헥사곤 NPU는 동급 최고의 이기종 컴퓨팅 아키텍처인 퀄컴 AI 엔진의 핵심 프로세서로 퀄컴 아드레노 GPU, 퀄컴 크라이오(Qualcomm Kryo) 또는 퀄컴 오리온 CPU, 퀄컴 센싱 허브 및 메모리 서브시스템도 포함한다. 이러한 프로세서는 함께 작동하여 디바이스에서 AI 애플리케이션을 빠르고 효율적으로 실행하도록 설계되었다.
AI 벤치마크와 실제 생성 AI 애플리케이션에서 업계를 선도하는 성능이 이를 입증했다. NPU, 기타 이기종 프로세서, 스냅드레곤 8 3세대(Snapdragon 8 Gen 3) 및 스냅 드래곤 X 엘리트(Snapdragon X Elite)의 업계 최고의 AI 성능과 NPU와 이기종 컴퓨팅으로 온디바이스 생성 AI 활용에 대한 자세한 내용은 백서(Unlocking on-device generative AI with an NPU and heterogeneous computing-다운)'을 참고하면 된다.
개발자가 생성 AI 애플리케이션을 가속화할 수 있도록 지원
퀄컴과 스냅드래곤 플랫폼으로 구동되는 전 세계 수십억 개의 디바이스에서 개발 및 배포의 용이성에 초점을 맞춰 개발자를 지원한다. 개발자는 퀄컴 AI 스택(Qualcomm AI Stack-다운)을 사용하여 하드웨어에서 AI 애플리케이션을 생성, 최적화 및 배포할 수 있으며, 한 번만 작성하면 칩셋 솔루션을 사용하여 다양한 제품 및 세그먼트에 걸쳐 배포할 수 있다.
온디바이스 AI는 더 유능하고, 비용 효율적이며, 신뢰할 수 있고, 프라이빗하고, 안전하며, 미래로 나아갈 수 있는 원동력이 된다. 클라우드 AI와 조화롭게 작동할 수 있는 엣지 디바이스는 신뢰할 수 있는 컴퓨팅 성능으로 더 빠르고 효율적이며 고도로 최적화된 AI를 제공한다.
'Scrapbook > News Scrap' 카테고리의 다른 글
[기사 스크랩] 또 하나의 거대 플랫폼 탄생하나...'GPT 스토어' (0) | 2024.07.25 |
---|---|
[기사 스크랩] SKT, 6G 실측 및 시뮬레이션으로 주파수·망 구조 연구 (0) | 2024.07.24 |
[기사 스크랩] SKT, 5G 진화 ∙ 6G 준비 위한 차세대 가상화 기지국 기술 개발 성공 (0) | 2024.07.22 |
[기사 스크랩] 청룡 기운 받았나...심상치 않은 MS·업스테이지 (0) | 2024.07.21 |
[ 기사 스크랩 ] KT, UAM과 위성통신 주제로 ‘6G 포럼 이슈리포트’ 발간 (0) | 2024.07.20 |