크게 크게 작게 작게
페이스북 트윗터
정보로 바꿔주는 '머신러닝' 제대로 이해하기
빅데이터 사용 가능하게 가공
입력 : 2015-07-14 오전 11:01:03
머신러닝(Machine learing)이 기업 경영에 화두로 떠오르고 있지만, 단어만 봐서는 무엇을 말하는 것인지 잘 감이 잡히지 않는다. 직역하면 기계 학습인데, 왜 이런 개념이 등장했는지도 아리송하다. 머신러닝 덕분에 포털 사이트의 자동검색기능이 생겨나고 범죄 예측도 가능해졌지만, 거기에 어떤 기술이 접목됐는지 아는 사람은 드물다. 그러나 머신러닝은 글로벌 시장조사업체인 가트너(Gartner)가 ‘주목해야 할 2015년의 기술 분야’로 꼽을 정도로 중요한 기술이라 이해하고 넘어가야 한다.
 
◇한 여인이 샌프란시스코 애플 모바일 애플리케이션 데이타
모형이 있는 쪽으로 걸어가고 있다 (사진=로이터)
미국 경제전문 학술지 하버드비즈니스리뷰는 머신러닝을 몇 가지 키워드로 나누어 설명해 준다. 우선 머신러닝을 이해하려면 빅데이터가 뭔지를 알아야 한다. 빅데이터는 엄청난 양의 문자와 영상, 수치 등의 정보를 말한다. 인터넷이 발달하면서 데이터 축적량이 폭증하자 데이터 앞에 ‘빅‘자가 붙었다. 머신러닝은 바로 이 빅데이터를 분석해 미래를 예측하는 기술을 말한다. 아무리 좋은 식재료가 있어도 레시피가 없으면 음식을 만들지 못하는 것처럼, 머신러닝은 빅데이터를 사용 가능한 형태로 가공해 준다. 유의미한 정보만을 취합해 준다는 뜻이다. 기업은 이 기술을 이용해 고객의 구매내역, 인터넷 방문 흔적, 댓글 등 보유 중인 엄청난 양의 정보를 마케팅 전략으로 활용할 수 있다. 머신러닝이 고객의 과거 정보를 토대로 그가 어떤 상품을 얼마나 사들일지를 예측해주기 때문이다.
 
과거의 자료를 토대로 미래를 예측하는 것은 새삼스러운 일이 아니다. 단순 통계학으로도 이런 일은 충분히 가능하다. 그런데도 머신러닝이 각광받고 있는 이유는 크게 두 가지로 나뉜다. 선후관계에 얽매이지 않는다는 점과 예측 결과에 따른 피드백이 가능하다는 것이다. 머신러닝은 통계와 달리 선후관계를 따지지 않는다. 가령 비라는 결과가 나오기 전가지 하늘에 구름이 끼고 수증기가 증발하는 등의 과정이 있는데, 머신러닝은 이런 정보보다 비가 내리는지에만 집중한다. 비가 오는지를 예측해 우산을 준비할 수 있도록 돕는 것이 우선이지, 그 전 과정은 전혀 중요하지 않다. 또 한가지는 학습능력이다. 머신러닝이 딥러닝(deep learning)으로도 불리는 이유이기도 한데, 머신러닝은 전에 내렸던 결정이 맞았는지를 스스로 체크해, 그 결과를 다음번 예측 결정에 반영한다. 자신의 실수를 거울삼아 예지력을 키운다는 뜻이다. 가령 고객이 예측대로 움직였는지, 추천했던 아이템을 클릭했는지, 예측했던 상품을 정말로 샀는지, 신용 정도는 어떤지 등을 파악해 데이터 베이스에 저장한다.
 
머신러닝의 기능은 이 밖에도 다양하다. 특성 추출(Feature Extraction)은 데이터 중복이 심해서 처리할 정보량이 많을 때 이를 요약해 주는 것을 말한다. 레코드 가게가 음악을 락과 발라드, 랩 등으로 구분해서 진열하듯 머신러닝도 데이터를 특성 별로 묶어준다. 이 기능을 적용한 기술이 바로 얼굴 인식 기능이다. 특성 추출은 수 많은 인파 속에서 특정 사람을 찾을 때 쓰인다. 제약(Regularization)은 방대한 양의 정보를 걸러주는 기능이다. 어떤 물질을 체에 쳐서 거르듯, 쓰고자 하는 정보만을 내려 보내고 나머지는 걸러낸다.
 
윤석진 기자 ddagu@etomato.com
 
윤석진 기자


- 경제전문 멀티미디어 뉴스통신 뉴스토마토

관련 기사