[중앙뉴스= 이광재 기자] 아마존웹서비스(Amazon Web Services, 이하 AWS)가 ‘AWS 리인벤트(re:Invent) 2023’에서 LG그룹의 인공지능(AI) 연구 허브인 ‘LG AI연구원’이 AWS 기반으로 AI 이미지-투-텍스트(image-to-text) 캡셔닝 솔루션을 출시했다고 발표했다.

신규 캡션 솔루션은 3000억개의 파라미터를 보유한 LG AI연구원의 멀티모달 파운데이션 모델(FM)인 엑사원(EXAONE)을 활용한다. 엑사원은 광고, 패션, 리테일 등 다양한 산업 분야의 전세계 고객을 위해 보다 정확하고 관련성 높은 콘텐츠를 위한 캡셔닝 솔루션을 제공한다.

엑사원의 새로운 제로샷 이미지 캡션 솔루션은 생성형 AI를 사용해 인간의 인지 능력과 유사하게 이전의 경험과 지식, 훈련을 바탕으로 본 적 없는 객체나 장면을 자동으로 이해하고 설명한다. 이는 엑사원이 한국어와 영어로 된 이미지와 텍스트를 이해하고 인간에 가까운 추론 능력을 활용해 정확하고 상세한 이미지 캡션과 키워드를 작성할 수 있게 한다.

엑사원은 광고, 패션, 리테일 등 다양한 산업 분야의 전세계 고객을 위해 보다 정확하고 관련성 높은 콘텐츠를 위한 캡셔닝 솔루션을 제공한다. (제공=AWS)
엑사원은 광고, 패션, 리테일 등 다양한 산업 분야의 전세계 고객을 위해 보다 정확하고 관련성 높은 콘텐츠를 위한 캡셔닝 솔루션을 제공한다. (제공=AWS)

광고와 같은 산업군에서는 LG AI연구원의 기술을 활용해 제품 설명을 자동화하거나 광고·마케팅 캠페인을 위한 새로운 콘텐츠를 만들 수 있다. LG AI연구원은 엑사원의 학습 중 파라미터 수가 늘어나는 등 필요에 따라 비용 효율적으로 IT 리소스를 확장할 수 있도록 안전하고 조정 가능한 컴퓨팅 용량을 클라우드에서 제공하는 아마존 엘라스틱 컴퓨트 클라우드(Amazon EC2)를 사용한다.

소비재 기업, 마케팅 에이전시 등 LG AI연구원의 고객들은 AWS의 확장성을 활용해 시간당 2000개 이상의 이미지 캡션을 생성할 수 있다. LG AI연구원은 머신러닝(ML) 모델을 구축·훈련·배포하는 완전 관리형 서비스 아마존 세이지메이커(Amazon SageMaker)를 사용해 3억5000만개의 고해상도 이미지와 텍스트 세트를 엑사원에게 학습시켰다.

LG AI연구원은 클라우드를 사용해 온프레미스 인프라보다 더 빠르고 저렴한 비용으로 결과를 미세 조정하고 체크포인트를 구현하며 데이터 편향과 같은 문제를 신속하게 해결할 수 있었다.

이화영 LG AI연구원 상무는 “AI는 많은 산업에 혁신을 일으키고 있다. 우리는 사람들이 보다 창의적으로 일할 수 있도록 비용 효율적인 방식으로 지원할 수 있는 이 기술의 잠재력에 대해 갖는 기대가 크다”며 “LG AI연구원의 엑사원은 크리에이티브 분야에서 생성형 AI를 더 쉽게 활용할 수 있게 해주는 강력한 도구이며 AWS의 업계 선도적인 ML 역량은 우리가 혁신적인 솔루션을 빠르게 개발하고 배포하는 데 큰 도움이 됐다. 우리의 비전은 크리에이티브 영역이 새로운 차원의 효율성을 확보하고 기업이 이미지 검색 등의 반복적인 업무 대신 창작에 집중할 수 있도록 돕는 것”이라고 말했다.

LG AI연구원은 엑사원을 통해 다양한 크리에이티브 산업 분야에서의 생성형 AI 도입을 가속화하기 위해 전세계 여러 기관과 협력하고 있으며 그 일환으로 미국 유명 대학인 파슨스디자인스쿨(Parsons School of Design)과 협업해 패션, 디자인, 미디어 분야 전문가들과 함께 생성형 AI 관련 기술과 서비스를 개발하고 있다.

또 LG AI연구원은 엑사원을 활용해 텍스트 프롬프트에 따라 완전히 새로운 이미지를 만들어 내는 AI 버추얼 아티스트 틸다(Tilda)를 개발했다. 틸다는 3000개의 이미지와 패턴을 생성해 2022년 뉴욕 패션위크에서 박윤희 디자이너가 선보인 200여벌의 의상을 디자인하는 데 도움을 준 바 있다

LG AI연구원은 LG그룹 계열사에도 생성형 AI 솔루션을 제공하고 있다. LG생활건강은 지난 8월 LG AI연구원의 생성형 AI 기술이 AWS 상에서 만들어 낸 수천가지의 독특한 디자인을 피부나 의류에 인쇄할 수 있는 미니 즉석 타투 프린터 ‘임프린투(IMPRINTU)’를 출시했다.

또 LG AI연구원은 엑사원 모델을 LG 계열사에 제공해 가전 및 홈 엔터테인먼트 제품을 개발하는 엔지니어들의 생산성과 창의성을 높이고 소프트웨어 코드를 생성할 수 있도록 지원할 예정이다.

바시 필로민(Vasi Philomin) AWS 생성형 AI 부문 부사장은 “생성형 AI는 당대 가장 혁신적인 기술 중 하나로 생산성과 창의성에 큰 영향을 미치고 있다”며 “콘텐츠 생성 산업이 급성장하는 가운데 LG AI연구원은 엑사원 플랫폼과 같은 기술이 AWS에 구축된 신속한 이미지-투-텍스트 캡션 솔루션을 활용해 어떻게 AI, 디자이너, 아티스트 간의 협업을 촉진할 수 있는지 보여주고 있다. 전세계에 새로운 차원의 창의성이 발휘될 수 있도록 앞으로도 LG AI연구원의 생성형 AI 혁신과 확장을 지원할 수 있기를 기대한다”고 말했다.

저작권자 © 중앙뉴스 무단전재 및 재배포 금지