[더팩트ㅣ최문정 기자] 네이버가 인공지능(AI) 모델 전반에 대한 국산화 작업에 속도를 내고 있다.
17일 IT업계에 따르면, 네이버클라우드는 지난달 이미지를 이해하고 분석하는 '비전 인코더'의 독자 개발을 완료했다. 향후 이 모델은 네이버의 다양한 멀티모달 AI 모델의 근간이 될 전망이다.
비전 인코더는 용어 그대로 시각 정보를 AI가 이해할 수 있는 정보로 변환하는 프로그램이다. 영상이나 이미지 등의 정보를 AI가 읽어내 텍스트뿐만 아니라 미디어를 오가는 '멀티모달' AI 모델을 구현하는 데 핵심 역할을 한다. AI 모델의 시신경인 셈이다.
올해 초 네이버는 정부 주도의 독자 AI 파운데이션 모델 프로젝트(독파모) 참여 당시 중국 알리바바의 오픈소스 모델인 '큐웬 2.5'의 기능을 일부 사용한 것이 알려지며 논란의 중심에 서기도 했다.
네이버는 100% 자체 개발한 비전 인코더 적용을 통해 AI 기술 경쟁력에 대한 의구심을 해소한다는 목표다.
비전 인코더는 데이터 수집부터 설계까지 전 과정을 회사가 직접 수행하는 '프롬 스크래치' 원칙에 따라 제작됐다. 이 과정에서 한국에 특화된 문화와 지리 등의 데이터를 학습한 것이 특징이다.
가령, 제주도의 돌하르방을 분석할 때, 외국의 모델은 이를 그냥 '석상'으로 분류하지만, 비전 인코더는 '돌하르방'이라는 고유명사로 인식한다. 이 모델이 한국어 기반으로 학습했기 때문에, 별도의 번역 과정 없이, 한국어와 이미지를 바로 연결해 정보 왜곡을 최소화할 수 있다는 설명이다.
네이버클라우드 관계자는 "현재 비전 인코더는 글로벌 모델과 견주었을 때도 부족하지 않은 성능을 확보했다"며 "앞으로 네이버가 발표하는 멀티모달 AI 라인업은 모두 비전 인코더를 적용할 예정"이라고 말했다.
jay09@tf.co.kr