"딥러닝 기반 영상인식으로 물류·리테일 솔루션 제공 플랫폼 구축"
(스타트업리포트)김종진 인터마인즈 대표
"인터마인즈는 인공지능 산업 전반 볼 수 있는 눈 갖춰"
"개발자 맘껏 뛰노는 놀이터 만드는 게 꿈"
입력 : 2017-11-24 06:00:00 수정 : 2017-11-24 06:00:00
[뉴스토마토 이우찬 기자] 인공지능(AI)은 인간의 영역으로 여겨졌던 바둑을 정복하며 자신의 이름을 널리 알렸다. 구글 딥마인드가 개발한 인공지능 프로그램 알파고는 2015년 유럽 바둑 챔피언 판우이 2단을 꺾었고, 지난해 이세돌 9단을 따돌렸다. 알파고는 머신러닝(기계학습)과 인간의 뇌 신경망을 결합한 '딥러닝'의 사례인데, 딥러닝을 통한 인공지능 영역은 의료·미디어·물류 등 산업 전반으로 확장되고 있다.
이 가운데 국내 스타트업 '인터마인즈'는 지난해 8월 창업해 업력이 1년을 갓 넘었지만, 동영상·이미지 등을 인식하는 딥러닝 분야에서 독보적인 기술력을 보유한 회사다. 인터마인즈는 인공지능 가운데 시각지능에 특화된 기업이다. 머신러닝 기반으로 학습을 한 인공지능이 인간처럼 동영상과 이미지를 이해하고 판단할 수 있는 기술을 가지고 있다. 예를 들어 고양이 이미지라면 인공지능은 수많은 픽셀(이미지를 구성하는 최소 단위인 점)로 이뤄진 이 같은 이미지를 쪼개고, 비슷한 패턴끼리 가중치를 부여하는 방식으로 학습한 뒤 대상을 고양이로 추론하고 인식하게 된다. 인터마인즈 기술의 핵심은 동영상 인식 기술에 있다. 동영상 인식은 움직임이 있으므로 고난이도 기술로 분류된다. 인공지능이 동작의 의미를 파악하는데서 나아가 배경과 사물을 분리해서 인식하는 기술 등이 필요하기 때문이다. 인터마인즈는 정지된 이미지를 인식하는 인공지능 신경망 CNN(회선신경망)과 과거 히스토리를 기억해 의미 있는 동작을 인식하는 RNN(순환신경망) 융합기술을 활용해 고도화된 엔진 개발에 성공했다.
 
인터마인즈를 이끌고 있는 김종진(53) 대표는 광고와 유통 쪽에서 잔뼈가 굵은 인물이다. 직전에 광고회사 인터웍스 대표를 역임했다. 인터웍스는 애드네트워크 회사로 텍스트를 분석해 온라인 뉴스 카테고리를 분류한 뒤 적합한 광고를 매칭하는 일을 한다. 이 작업은 전통적인 머신러닝 기반의 텍스트 분석이다. 김 대표는 "머신러닝 기반의 인터웍스에서 딥러닝의 흐름을 자연스럽게 접하고 흐름을 이해하게 됐다"고 말했다. 인터웍스 등의 주도로 언어지능·음성인식 인공지능 기업 마인즈랩이 탄생했고, 일종의 스핀오프 방식으로 시각지능으로 특화된 인터마인즈가 설립됐다. 김 대표는 마인즈랩 대표로 10개월가량 일했다. 김 대표는 "딥러닝 기반의 비디오·이미지 인식 기술로 물류와 리테일 관련 솔루션을 제공하는 플랫폼을 구축하는 게 목표"라고 말했다.
 
‘아마존 저리가’ 독보적인 영상인식 인공지능
 
인터마인즈의 경쟁력은 독보적인 기술력에 있다. 동작을 판단할 수 있는 영상인식 인공지능이 핵심이다. 자체 개발해 특허 출원한 자동 크롭핑(cropping) 기술을 활용해 학습 데이터를 최적화한다. 배경에서 상품 이미지를 분리하는 자동화 기술이다. 이 기술은 빠른 시간 안에 데이터를 생성하는 데 필수적이다. 양질의 많은 데이터를 빠르게 확보한다면 인공지능의 학습 속도도 빨라진다.
 
실생활과 밀접하게 닿아있는 마트에서 인공지능을 구현할 수 있는 기반을 닦는 데 성공했다. 공식 명칭은 '다량의 상품 및 구매여부(동작) 인식' 기술이다. 지난 6월 모 슈퍼와 POC(proof of concept)를 했다. POC는 아직 시장에 선보이지 않은 기술 등이 특수한 문제를 해결할 수 있음을 증명하는 과정이다. 신제품 사전 검증이 목적이다. 인터마인즈는 마트에서 파는 20여종의 상품을 대상으로 90% 중반대의 높은 인식 성공률을 기록했다. 카트에 달린 인공지능 카메라가 초코파이 등 20여종의 상품을 구별해 인식할 수 있고, 구매 동작인지 구매 동작이 아닌지를 판단할 수 있다. 예를 들어 고객이 매대에서 초코파이를 꺼내는 동작을 하면 구매로 판단하고, 거꾸로 카트에서 꺼내 매대로 올려놓는 동작을 하면 구매 취소 행위로 인식할 수 있는 것이다. 1000원짜리 초코파이 5개가 카트에 담겼다면 인공지능이 5000원으로 계산할 수 있다는 의미다. 카트와 연동할 수 있는 애플리케이션 등 결제시스템이 구축되면 마트 직원의 도움 없이도 결제를 할 수 있게 된다.
 
인터마인즈의 인공지능이 한 마트에 있는 상품을 분류해 구매 동작을 인식하는 모습. 사진=인터마인즈
 
김종진 대표는 "20여개 상품을 선정할 때 상품군을 1500~2000개로 확대했을 경우 나타날 수 있는 문제점을 고려했다"며 "포장은 비슷하지만 상품 이름이 다른 경우, 굉장히 작은 크기의 상품 등이 그렇다"고 말했다. 시각지능은 거리에 따라 달라지는 사물 크기를 판별하는 게 쉽지 않은데, 90% 중반의 높은 사물·동작 인식으로 인터마인즈는 독보적인 기술력을 자랑한 셈이다. 이 같은 기술은 1000여개 안팎의 상품군을 지닌 편의점 등 소형 마트에서 활용이 가능할 것으로 기대된다. 뿐만 아니라 인터마인즈 인공지능은 육안으로 구분하기 어려운 50개 이상의 주류·음료를 동시에 인식·구분하는 데 성공했고, 색깔에 관계없이 바나나 등을 100% 가까이 인식했다.
 
인터마인즈 기술은 미국 최대 온라인쇼핑몰 아마존에 있는 인공지능과 유사하다. 오히려 비용은 인터마인즈가 적게 든다. 아마존은 지난해 말 시애틀에 직원 없는 '무인점포'를 열었다. '아마존고(GO)' 애플리케이션을 연동한 뒤 상품을 카트에 담고 나가면 따로 계산대를 거칠 필요 없이 자동으로 결제가 되는 식이다. 아마존에서는 매대 곳곳에 설치돼있는 카메라로 상품과 구매 여부를 인식하는 것으로 알려져 있다. 그만큼 많은 카메라가 필요해 비용이 많이 드는 단점이 있다.
 
인터마인즈의 동작 인식 인공지능은 시각 활용 품질검사인 '비전 인스펙션(vision inspection)'에도 활용할 수 있다. 제품의 불량 여부를 판단하는 도구다. 예컨대 컨베이어 벨트를 타고 밀려드는 제품을 인공지능이 정품과 불량품으로 구분해 판단하는 것이다. 컨베이어 벨트가 멈추지 않고도 인공지능이 동영상 인식을 통해 프레임을 쪼개서 인식하므로 제품 불량 여부를 실시간 판별할 수 있다. 실시간으로 밀려들어오는 동영상 속 이미지 정보에서 배경과 제품을, 정상품과 불량품 등으로 구분하는 고난도 기술이다. 김 대표는 "인터마인즈 인공지능으로 1초당 240프레임까지 뽑아낼 수 있다"면서 "(배경에서) 이미지를 뽑아내는 추출기술이 필요하고, 정확하게 판단하는 기술이 모두 필요하다. 또한 고해상도를 쓰면서도 컴퓨팅 파워를 적게 유지하면서 해석할 수 있는 능력이 요구된다"고 말했다.
 
사진=인터마인즈
 
인터마인즈는 지난달 한 대형 건축자재 업체와 인조대리석 검수를 위한 POC를 했다. 컨베이어벨트를 지나 밀려오는 인조대리석을 전수 검사하는 게 가능하다는 결과를 얻었다. 인조대리석 검수는 자동화가 안돼 사람이 1차적으로 눈으로 보고 판별하는 식으로 이뤄지는 것으로 알려졌다. 전수 검사도 불가능해 10장 또는 100장당 1장씩 검수해 데이터를 뽑아 불량품을 판별했다. 인터마인즈는 이 회사에 넣을 제안서를 준비 중이다.
 
'무궁무진' 확대 가능한 사업 영역
 
동작인식 기반의 인공지능을 활용한 사업 영역은 무궁무진하다. 인터마인즈는 우선 물류와 리테일(소매) 쪽에 집중할 계획이다. 편의점 등 소매점에서는 계산 직원 없는 셀프 체크아웃 시스템을 구축하는 데 인터마인즈 기술이 활용 가능하다. 중소형 물류 공장에서는 재고 파악 시스템을 도입할 때 쓸 수 있다. 동작 인식이 가능한 점은 자율주행과 연관이 있다. 매장 내에서 카메라 인공지능을 장착한 로봇이 매장 재고와 상품 불량 여부 등을 파악해 매장 효율화를 꾀할 수 있다. 기계적으로 레일을 깔아 물류 관리를 하지 않고도 시각지능 로봇으로 사람 동선과 겹치지 않는 시스템 관리가 가능하다.
 
이른바 '스마트거울'로 산업통상자원부와 과제를 진행 중이다. 인공지능 카메라가 얼굴을 진단한 뒤 눈, 코, 입, 귀를 분리해 연예인 닮은꼴을 매칭해주고 그에 맞는 화장법을 추천하는 콘텐츠를 제공하는 것이다. 인터마인즈는 최근 인공지능을 활용한 '스마트벤딩머신 스토어' 개발에도 착수했다.
 
경기 판교테크노밸리에 있는 인터마인즈에서 직원들이 일을 하고 있다. 사진=인터마인즈

개발자가 뛰노는 놀이터 만들자
 
인터마인즈는 김 대표를 포함한 총 6명으로 이뤄진, 작지만 개발 열정으로 똘똘 뭉친 직원들이 노는 기업이다. 김신화(37) 이사를 포함해 우수빈·안혜영·이무늬 매니져가 있고, 한철 고려대 전자정보학 교수가 자문을 맡고 있다. 김신화 이사는 CTO(최고기술책임자)로 인터마인즈에서 허브 역할을 하는 핵심이다. 딥러닝 신경망 CNN+RNN융합 기술과 실시간 영상기반 동작인식 엔진을 개발했고, 자동 크롭핑 툴을 개발해 특허 출원했다. 김 이사는 LG유플러스 연구소에서 4년간 일했고, 구글코리아에서는 검색 품질 관련 일을 했다. 굴지의 대기업을 마다하고 스타트업으로 옮긴 이유는 뭘까. 김 이사는 "가족도 걱정했고, 주변서 보기에는 좀 과격한 선택으로 보일 수 있지만 하는 일이 가장 중요한 결정 기준이었다"며 "소속이 어디인지보다 앞으로 전망이 어떤지가 중요해 이직을 결심했다"고 말했다. 그는 "인공지능은 전망이 밝은 분야다. 피할 수 없는 흐름이라는 판단이 들었다"고 강조했다. 김 이사는 산울림 김창완씨의 외아들이다.
 
김신화 인터마인즈 최고기술책임자. 사진=인터마인즈
 
인터마인즈의 비전은 개발자들의 열정에서 찾을 수 있다. 김 대표는 "스타트업으로 세계적인 인공지능 공룡 기업과 맞서기는 어렵겠지만 인터마인즈는 산업을 볼 줄 아는 눈을 지니고 있다"고 말했다. 이어 "젊은 기술자들이 뛰놀고 싶은 놀이터를 만드는 게 인터마인즈의 비전"이라고 힘주어 말했다.
 
김 이사는 현재를 말하면서도 시선은 미래를 향하고 있다. 혁신, 혁명으로 등장했던 스마트폰이 필수품으로 자리 잡은 것처럼 인공지능 또한 삶의 일부로 자연스러워지는 시기가 올 것이라는 믿음이다. 인공지능은 끊임없이 발전을 거듭해오고 있을 뿐이다. 김 이사는 "10년이 지나면 인공지능 서비스를 누구나 당연하게 여기고 쉽게 이용하는 시대가 될 거 같다"며 "인공지능은 미래 기술이 아닌 현재 누구나 볼 수 있는 상품에 녹아들어가고 있는 기술"이라고 했다. 인터마인즈는 인공지능 기술 고도화에 매진하면서도 그 이후를 고민하고 있다.
 
김종진 인터마인즈 대표이사. 사진=인터마인즈
 
이우찬 기자 iamrainshine@etomato.com
 

ⓒ 맛있는 뉴스토마토, 무단 전재 - 재배포 금지

  • 이우찬

중소벤처기업부, 중기 가전 등을 취재합니다.

  • 뉴스카페
  • email
  • facebook