SAS, 텍스트 마이닝 업체 ‘테라그램(Teragram)’ 인수
텍스트 마이닝은 텍스트 데이터 또는 웹 페이지, 문서, 이메일, 이미지와 같은 비정형 데이터를 분석하는 기술로써, SAS는 이 분야의 개척자로써 이미 수십 년 전부터 텍스트 마이닝 기술을 자사 제품에 적용하기 시작했으며, 2002년에는 고급 텍스트 마이닝 제품인 ‘SAS Text Miner’를 출시한 바 있다.
이번에 인수된 ‘테라그램’의 자연 언어 처리 (NLP) 기술은 한국어 등 30여개 언어 지원이 가능하고 CNN, 포브스닷컴, 뉴욕타임즈 디지털, 소니, 워싱턴포스트닷컴, 세계 은행과 야후등 유수의 고객들에 의해 그 기술력이 입증된 바 있으며 이제 SAS의 텍스트 마이닝 솔루션인 ‘SAS Text Miner’ 뿐만 아니라 통합 BI플랫폼인 ‘SAS 엔터프라이즈 인텔리전스 플랫폼’ 전체에 걸쳐서 적용됨으로써 사용자는 결과물을 더 빠르게 도출해 낼 수 있게 되었다.
또한 ‘테라그램’의 정교한 검색 기술은 사용이 간편한 BI 환경을 제공할 뿐 아니라, 조직 전반에 걸쳐 BI의 가용성을 극대화시켜 주어서 SAS와 테라그램 기술이 결합되면 단순히 보고서의 제목이 아닌 실제 컨텐츠나 관련 메타데이터에 근거한 색인 생성이 가능해진다.
비정형 데이터는 최근 전 세계적으로 데이터가 폭발적으로 증가하면서, 대다수의 데이터들이 종래의 정형화된 데이터베이스의 영역 밖에 있는 것으로 밝혀지면서 더욱 중요하게 다루어지고 있다. 특히 기업 내에서 전체 비즈니스 데이터 중 비정형 데이터가 차지하는 비율은 70%에 달하고 있으며, 이런 데이터는 주로 고객의 의견, 서비스 청구서, 이메일 및 채팅, 서류 및 조사 보고서, 블로그나 RSS 피드, 품질 보증 청구, 이력서, 음성메일이나 전화 로그, 기타 등등 헤아릴 수 없을 정도로 다양한 소스들로부터 생성되고 있다.
테라그램의 기술이 접목되는 SAS Text Miner는 2002년 출시된 이래, ‘SAS 품질보증분석 솔루션’을 비롯한 다양한 SAS 비즈니스 솔루션에 포함되어 제공되고 있다. 제조업계에서는 이 솔루션을 비정형 데이터 현상이 두드러진 품질 보증 청구와 서비스 관련 데이터들을 통합 및 분석하는데 사용하고 있으며 잠재적 문제점을 조기에 발견함으로써 이에 신속히 대응할 수 있음은 물론 소비자의 만족도와 충성도, 그리고 제품의 질까지도 획기적으로 향상시킬 수 있다.
은행에서는 고객의 전화 문의 내용이나 관련 메타데이터(통화 시간, 대기 시간, 통화 전환 횟수)에 텍스트 분석 기법을 적용하여, 고객의 신용도가 양호한지, 또는 거래 관계가 지속될 지의 여부 등 고객의 만족도 측정과 결과 예측을 실시하고 있다. 그리고 보험사의 경우에는 손해 사정인의 보험금 청구서와 보험사기 가능성을 조사하기 위한 인구 통계학 정보에 이 텍스트 분석 기법을 이용하고 있다.
한편 SAS코리아의 조성식 대표는 본사의 테라그램 인수와 관련하여 “기업이 고객, 시장 기회, 내부 운영, 공급망 등 비정형 데이터에 대한 분석을 간과하거나 등한시 할 경우, 큰 그림을 볼 수 없게 되어 결국 잘못된 의사 결정을 내릴 공산이 커진다. 따라서 한국어 등 30여개 언어 지원이 가능한 테라그램의 기술을 SAS 텍스트 마이닝 솔루션에 접목하게 된 것은 고객 중심의 혁신을 전개해 나아가는 본사 R&D정책과 마케팅의 결과이다”라고 강조했다.
웹사이트: http://www.sas.com/korea
연락처
SAS코리아 김현민 과장 02-2191-7031 016-358-9098 정미교 이사 016-713-2771