[뉴스토마토 이지은 기자] 정부가 디지털 뉴딜 핵심으로 꼽히는 데이터 댐 구축에 나선다. 이를 위해 인공지능(AI) 학습용 데이터 20종을 선정, 데이터 확대 구축에 나선다는 방침이다.
과학기술정보통신부는 21일 AI 개발에 필수적인 양질의 데이터를 대규모로 구축·개방하는 AI 학습용 데이터 구축 사업의 20개 과제를 확정했다고 밝혔다.
지난해보다 과제가 2배 늘어났으며, 예산도 지난해 195억원에서 올해 390억원으로 대폭 늘었다.
데이터 댐 구상 예시, 추경 정부안 기준. 자료/과기정통부
선정분야는 △사람의 감성과 문맥을 이해할 수 있는 자연어 처리분야 △자동차·드론 등 자율주행기술 분야 △음성·시각·언어 등 융합 분야 등 국가적으로 산업적으로 활용가치가 높고 데이터 확보 필요성이 시급한 과제를 선정했다. 아울러△질병진단(치매, 구강질병 등)·운동 등 헬스케어 분야 △사람의 얼굴을 악의적으로 변조한 딥페이크 방지 기술 분야 △장애인의 삶을 향상 시킬 수 있는 분야 등 국민 생활을 윤택하게 하고 사회적 문제를 해결할 수 있는 과제 등이 선정됐다.
과기정통부는 지난해 2개 과제를 크라우드소싱 방식으로 추진한 데 이어 올해는 모든 과제에 전면적으로 크라우드 소싱 방식을 적용해 AI 학습용 데이터를 구축함으로써 일자리를 만들어갈 예정이다.
아울러 과기정통부는 올해 추경예산을 통해 코로나19 이후 경기침체를 극복하기 위해 일자리 창출효과가 크고 AI모델 개발에 필수적인 AI 학습용 데이터 구축 사업을 확대 추진할 계획이다. 총 150개 종류의 AI 학습용 데이터를 구축하고 AI 통합 지원 플랫폼인 AI 허브를 통해 무료 개방할 계획이다.
과기정통부는 "중소기업과 스타트업 등은 비용부담과 인력부족 때문에 필요한 AI 학습용 데이터를 직접 구축하는 데 어려움이 많아서, 양질의 데이터 확보에 대한 수요가 크다"며 "AI 학습용 데이터 구축을 대규모로 확대·구축해 데이터 댐에 모으고, 다양한 AI 기술연구, 상용화 서비스 개발에 활용할 수 있도록 지원하겠다"고 말했다.
이지은 기자 jieunee@etomato.com
이 기사는 뉴스토마토 보도준칙 및 윤리강령에 따라 김충범 테크지식산업부장이 최종 확인·수정했습니다.
ⓒ 맛있는 뉴스토마토, 무단 전재 - 재배포 금지