이모티콘, 감성 분석의 핵심 요소로 떠오르다

감성분석, 자연어처리, NLP, 머신러닝, 인공지능, 이모티콘, 분석, 챗봇


지난 7월 17일, 세계 이모티콘의 날을 맞아 애플, 유튜브, 페이스북 등 글로벌 기업들은 새로운 이모티콘을 공개하고 관련 설문조사 결과를 발표하는 등 다양한 이벤트를 진행했는데요. 많은 사람들이 습관처럼 사용하는 이모티콘은 온라인 비주얼 커뮤니케이션이라는 새로운 트렌드의 핵심 요소로 자리잡았습니다.


온라인, 특히 모바일에서 빠르고 명확하게 표현을 전달해야 할 때 이모티콘은 전 세계 누구와도 소통할 수 있는 하나의 언어로서 역할하고 있습니다. 고객과 기업 모두 이 사실을 잘 인지하고 있는데요. 기업은 이모티콘에 대한 데이터를 수집, 분석해 고객이 신제품과 새로운 캠페인 또는 브랜드 자체를 어떻게 생각하고 있는지에 대해 유용한 인사이트를 얻을 수 있습니다. 이모티콘은 사용자의 기분, 태도, 의견을 묘사하기 때문에 소비자 참여를 개선해야 할 부분을 식별할 때에도 유용한데요. 이 모든 인사이트를 도출할 수 있는 방법으로 ‘감성 분석(sentiment analysis)’의 중요성 역시 커지고 있습니다.



감성 분석이란 무엇이고, 어떻게 시행해야 할까요?

감성 분석의 목적은 자연어 텍스트와 이미지에서 드러나는 생각이나 감성과 같은 주관적인 정보를 추출할 수 있는 자동화 툴을 정의하는 것입니다. 페이스북, 트위터와 같은 소셜 미디어(SNS) 상의 게시물을 다룰 때에는 새로운 유형의 콘텐츠와 확산 모델을 사용해야 하는데요. 이때 언어부터 명확하게 모델링 되어야 합니다.


대개 표준적이고 일관적이며 길이가 최소 한 단락 이상인 텍스트를 리뷰와 같이 문장이 잘 구성된 마이크로블로그(microblog) 콘텐츠로 분류하는데요. 그러나 소셜 미디어 콘텐츠에 대한 감성 분석에는 새롭고 더 복잡한 시나리오가 요구됩니다. 소셜 미디어 사용자들은 비격식적인 일상 언어와 비표준적인 철자를 사용한 두 문장 길이의 텍스트로 감성을 전달하기 때문인데요.


이 새로운 시나리오에서 연구자는 머신러닝 모델을 사용해 감성 분석 작업을 해결하는 전통적인 접근 방식을 커뮤니케이션을 지향하는 새로운 패러다임으로 전환할 수 있습니다. 실제 사회적 언어를 처리하는 과정에 이모티콘이 활용되기 시작하면서 머신러닝 연구자들이 감성 분류 작업에 참여하기 시작했습니다.


감성분석, 자연어처리, NLP, 머신러닝, 인공지능, 이모티콘, 분석, 챗봇


이모티콘은 감성을 나타내는 편리하고 신뢰할 수 있는 지표입니다. 따라서 자동으로 머신러닝 학습 자료를 생성하거나, 감성 분류를 향상시키는 증거로서 활용될 수 있는데요. 이모티콘은 말을 할 때 얼굴 표정과 같이 문자에서 표현적이고 비언어적인 요소로 작용합니다. 즉 시각적인 표현으로서 문장에 긍정적이거나 부정적인 감성을 부여하는 실용적인 역할을 합니다.


이모티콘 속 감성은 크게 긍정과 부정이라는 두 가지 카테고리로 분류됩니다. 흔히 쓰이는 긍정적인 이모티콘으로는 :-), :), =), :D 등이 있고, 부정적인 이모티콘으로는 :-(, :(, =(, ;( 등이 있는데요. 이런 이모티콘은 감성의 양극을 구분하는 중요한 정보입니다. 실제 소셜 미디어 상의 긍정적이거나 부정적인 메시지는 이모티콘을 표함할 확률이 높습니다.


감성분석, 자연어처리, NLP, 머신러닝, 인공지능, 이모티콘, 분석, 챗봇



이모티콘 활용해 감성 분석하기

주요 커뮤니케이션 방법으로 자리잡은 소셜 미디어는 감성 분석을 위한 아주 매력적인 데이터 소스입니다.

기업은 소셜 미디어의 텍스트뿐 아니라 이모티콘을 사용해 감성 분석의 효율과 정확성을 높일 수 있습니다. 나날이 발전하는 기술 덕분에 사람들의 소통 방식 역시 끊임없이 변화하고 있는데요. 고객이 말하는 것을 이해하기 위해 기업은 듣는 방식을 바꿔가야 합니다. 여기서 이모티콘은 더욱 중요해질 것입니다.


SAS의 인공지능(AI) 기반 비정형 데이터 분석 솔루션 ‘SAS 비주얼 텍스트 애널리틱스(SAS® Visual Text Analytics)는 감성 분석, 음성 텍스트 변환, 자연어 이해 및 생성 등 다양한 기능으로 기업이 이전까지 활용하지 못했던 데이터를 평가, 분석해 인사이트를 도출하도록 지원합니다. 기업은 텍스트에 표현된 고객의 어투나 긍정, 부정, 중립 등의 태도를 보여주는 용어, 구문, 문자열을 식별하고 감성을 분석할 수 있습니다.


감성분석, 자연어처리, NLP, 머신러닝, 인공지능, 이모티콘, 분석, 챗봇


대표적으로 롯데카드는 SAS의 인공지능 기반 텍스트 분석 기술을 도입해 신용카드 업계 최초로 실제 대고객 업무를 처리하는 인공지능 기반 챗봇 ‘로카’를 운영하고 있는데요. SAS는 피노텍과 함께 고정밀 자연어처리 기법의 텍스트 분석, 머신러닝, 학습 자동화 등 고급 분석 기술을 활용해 자주 묻는 질문(FAQ)을 처리하는 기본적인 수준의 챗봇에서 한층 진화한 지능형 챗봇을 구축했습니다.


로카는 개인정보변경, 즉시결제, 카드 및 금융서비스 신청 등 주요 카드 업무를 수행합니다. 또한 FAQ, 이메일, 채팅, 위키(wiki) 등 다양한 소스로부터 데이터를 수집, 분석, 가공하고 SAS의 셀프 러닝 기능을 이용해 대화 내용을 스스로 재학습하면서 성능을 발전시킵니다. 롯데카드는 감성 분석, 엔티티(entity) 추출 등 SAS의 비정형 데이터 분석 기능으로 대화 내용을 분석하고 데이터베이스(DB)를 생성해 이를 기반으로 고객 맞춤형 마케팅 프로그램을 강화하고 있습니다.


SAS 웹사이트에서 ‘포레스터 웨이브: 2018년 2분기 인공지능(AI) 기반 텍스트 분석 플랫폼’ 보고서에서 리더로 선정된 SAS 비주얼 텍스트 애널리틱스에 대해 자세히 확인해보세요.





저자

페데리코 알베르토 포지(Federico Alberto Pozzi) l SAS IMM & 분석 부문 수석 솔루션 전문가(SAS Sr Solutions Specialist in IMM & Analytics)


편집

구방본 이사 l SAS코리아 자연어처리(NLP) 및 텍스트 분석 전문가