크게 크게 작게 작게
페이스북 트윗터
구글 "신경망 기계번역 도입 후 오류 최대 85% 줄어"
"영어-한국어 번역 트래픽 50% 증가"
입력 : 2017-02-09 오후 5:50:20
[뉴스토마토 정문경기자] 구글이 신경망 기계번역 기술(GNMT)을 번역서비스에 적용하면서 완성도를 높인 결과 오류가 55%~85% 가량 줄어들었다. 기술 적용뒤 영어와 한국어 번역 트래픽이 지난 2개월 동안 50% 증가했다.
 
구글은 9일 서울 강남 구글캠퍼스에서 연 'AI 포럼'에서 발표나로 나선 마이크 슈스터 구글 리서치 사이언티스트는 "10년 전 구글 번역은 몇 개의 소수 언어에서 시작해 이제는 103개 언어를 지원하고 매일 1400억 단어를 번역하는 수준에 이르렀다"며 "여러 분야에 혁신을 가져온 신경망 기술로 인해 번역 품질을 개선하는 동시에 구글 번역의 기반 기술을 재고해보게 됐다"고 밝혔다.
 
9일 서울 삼성동 구글캠퍼스에서 열린 'AI포럼'에서 마이크 슈스터 구글 리서치 사이언티스트가 발표를 하고 있다. 사진/정문경 기자
 
 
구글은 이날 지난해 9월 '구글 신경망 기계번역' 기술을 공개하고 그해 11월에 한국어를 포함한 8개 언어, 총 16개 언어 조합에 적용했다. 신경망 기계번역은 기존 구문 기반 기계번역(PBMT)이 문장을 단어와 구 단위로 쪼개서 하나하나 개별적으로 번역한 것과는 달리 전체 문장을 하나의 번역 단위로 간주해 한꺼번에 번역한다.
 
슈스터 사이언티스트는 "신경망 기계번역 기술을 토대로 구축된 엔드-투-엔드(end-to-end) 학습 시스템으로 구글 번역은 번역된 문단 뿐만 아니라 전체 텍스트의 가독성이 상당히 향상됐다"며 "위키피디아와 뉴스 매체의 샘플 문장을 기준으로 주요 언어 조합을 평가했을 때 번역 오류는 55%~85%가량 줄어들었다"고 말했다.
 
이어 그는 "신경망 기계번역 기술을 적용한 이후 안드로이드에서 구글 번역의 트래픽(영어와 한국어 번역)이 지난 2개월동안 50% 이상 증가했다"고 말했다.
 
구글은 클라우드 서비스인 구글 클라우드 플랫폼을 공개해 구글의 머신러닝 기술을 이용할 수 있는 머신러닝 API를 제공하고 있다. 구글 클라우드 플랫폼에서는 구글 클라우드 번역 API를 통해 신경망 기계번역 시스템을 이용할 수 있다.
 
구글은 이전 GNMT시스템을 확장해 단일 시스템에서 여러 언어 간 번역이 가능하도록 하는 방식을 최근 채택했다. 슈스터 사이언티스트는 "언어 조합간의 번역이 가능해지는 기능을 개발했다"며 "영어와 한국어 번역과 스페인어와 영어 번역 등 여러 번역 언어들을 한데 묶어 조합 간 번역을 진행하도록해 하나의 언어로도 동시에 여러개의 언어로 구현할 수있도록 하는 기능"이라고 설명했다. 
 
정문경 기자 hm0829@etomato.com
 
정문경 기자


- 경제전문 멀티미디어 뉴스통신 뉴스토마토

관련 기사