네트워크 분석으로 살펴본 전 세계 이주민 현황


국제 이주민은 전 세계 인구의 3.5% 이상을 차지하고 있습니다. 즉 2억5천만 명 이상이 출생 국가 또는 국적과 다른 나라에서 살고 있다는 뜻인데요. 모든 이주민이 한 국가에 산다면 그 인구는 세계에서 다섯 번째로 클 것입니다. 전 세계 사회경제적 환경에 큰 영향을 미치는 이주와 난민은 여러 국가와 기업이 함께 해결해야 할 국제적 이슈로 자리잡았습니다.


SAS는 국제이주기구(IOM; International Organization for Migration)와 함께 실종 이주민을 보호하고, 자연 재해 복구 및 난민을 지원하는 등 다양한 구호 활동을 진행하고 있는데요. 이 과정에서는 이주민들이 어디에서 어디로 이동하고 있는지 파악하는 것이 중요합니다. 오늘은 빅데이터 시각화 솔루션 ‘SAS 비주얼 애널리틱스(SAS Visual Analytics)’를 이용해 이주 관련 데이터를 시각화하고, 이 질문에 대한 해답을 찾아보고자 합니다.



데이터 시각화 구상하기

먼저 UN 경제사회국 인구부에서 제공하는 이주 관련 데이터를 분석해 인터랙티브 시각화 보고서를 작성해보겠습니다. 이 데이터를 효과적으로 표현할 수 있는 가장 좋은 방법은 무엇일까요?


이 데이터는 많은 변수를 포함하지만, 그 중에서도 핵심은 아래 표에 나오는 연도, 출생지, 목적지, 이주민 수입니다. 성별이나 지역과 같은 다른 변수는 아래 이미지에서는 생략했습니다.


네트워크분석, 데이터시각화, 이주민, GatherIQ, 데이터포굿, CSR, 기업의사회적책임



지도에 이주 현황 시각화하기

오늘은 지리적 데이터를 다루기 때문에 지도에 시각화를 표현하려고 합니다. 우선 아래 지도는 출신 국가 하나만 표시한 결과입니다. 여기에서는 지리적 지도를 표시하는 두 가지 표준 방법을 사용했습니다.

  • (왼쪽) 버블 플롯(Bubble Plot) – 버블이 클수록 목적지로 이주한 이민지가 많습니다.

  • (오른쪽) 지역 – 국가의 음영이 어두울수록 이주민이 많습니다.


네트워크분석, 데이터시각화, 이주민, GatherIQ, 데이터포굿, CSR, 기업의사회적책임


한 눈에 어떤 목적지에 더 많은 이주민이 살고 있는지 확인할 수 있는데요. 그렇다면 이들은 어디에서 왔을까요? 이번에는 이주민들의 움직임을 나타내는 다른 방법을 살펴보겠습니다.


그 방법은 아마 많은 분들이 전혀 생각하지 못했던 곳에서 찾을 수 있습니다. 바로 네트워크 분석 오브젝트입니다. 이 분석 방법이 낯선 분들에게는 마치 하나의 거미줄처럼 보일 수 있는데요. 아래의 오브젝트는 위 지도에 적용한 것과 동일한 UN 데이터를 출신 국가로 필터링한 네트워크 분석 결과입니다. 각 노드의 크기는 목적지로 이동한 이주민의 수를 나타냅니다.


네트워크분석, 데이터시각화, 이주민, GatherIQ, 데이터포굿, CSR, 기업의사회적책임


그렇지만 이 시각화만으로는 무엇을 보여주려고 하는지 바로 이해하기 어려운데요. 이제 네트워크 분석 결과에 지도 배경을 추가해보겠습니다. 참고로 지도 배경 옵션은 소스와 타깃이 모두 지리적 항목으로 설정된 경우에만 사용할 수 있습니다. 네트워크 분석 기법을 사용했지만 지도 배경을 추가할 수 없다면 소스와 타깃이 지리적 오브젝트로 설정되지 않았을 가능성이 높습니다.


아래 지도는 위와 동일한 기본 네트워크 분석에 지도 배경만 추가한 결과입니다. 노드 사이에 링크가 추가됐고, 다른 지도 서비스를 선택한 것만 빼면 처음 설명한 버블 차트와 매우 유사하게 보이는데요.


네트워크분석, 데이터시각화, 이주민, GatherIQ, 데이터포굿, CSR, 기업의사회적책임


여기서 몇 가지 옵션을 변경하면 더 유용한 결과를 얻을 수 있습니다.

  • 노드 크기를 0으로 변경해 버블을 없애주세요.

  • 목적지 방향으로 화살표를 추가하세요.

  • 링크 곡률을 50%로 변경해 직선을 곡선으로 바꾸세요.

  • 목적지에 따라 링크에 색상을 추가하세요.

  • SAS가 제공하는 다양한 옵션을 활용해 지도 배경을 자신만의 스타일로 바꿀 수 있습니다.


이렇게 몇몇 옵션을 변경하면 아래와 같은 지도가 나옵니다. 이전 지도와 동일한 정보를 담고 있지만 훨씬 더 역동적으로 보이는데요. 네트워크 분석은 이주민의 출신지를 보여주고, 링크의 두께는 이주민 수, 색깔은 목적지를 나타냅니다. 한 눈에 이주민들이 어디에서 어디로 이동하고 있는지 알 수 있습니다!


네트워크분석, 데이터시각화, 이주민, GatherIQ, 데이터포굿, CSR, 기업의사회적책임


이번에는 이주 목적지를 기준으로 워드 클라우드를 추가해보겠습니다. 이렇게 하면 이주민의 출신을 기준으로 필터링해 지도와 워드 클라우드에서 이주민 수를 보다 빠르게 확인할 수 있습니다.


네트워크분석, 데이터시각화, 이주민, GatherIQ, 데이터포굿, CSR, 기업의사회적책임



다양한 데이터 탐색하기

지금까지 네트워크 분석을 사용해 SAS 비주얼 애널리틱스 리포트를 만드는 과정을 살펴보았는데요. 이 자료는 시민들의 지성, 전문성, 기술, 창의성을 한 데 모아 데이터를 중심으로 글로벌 문제의 해결을 돕는 크라우드소싱 애플리케이션 GatherIQ에 포함되어 있습니다. 지금 바로 구글 플레이 스토어와 애플 앱 스토어에서 GatherIQ 앱을 무료로 다운받고, ‘The world is on the move’ 라는 제목의 보고서를 클릭해보세요. 전 세계 이주민 현황에 대한 다양한 리포트를 탐색할 수 있습니다.


네트워크분석, 데이터시각화, 이주민, GatherIQ, 데이터포굿, CSR, 기업의사회적책임

SAS는 데이터를 활용해 빈곤, 건강, 인권, 교육 등 인도주의적 이슈를 해결하는 데이터 포 굿(Data for Good) 활동을 진행하고 있습니다. 최근에는 피플 매거진이 선정하는 ‘배려하는 기업(Companies That Care)’에 2년 연속 이름을 올리기도 했는데요. 더 나은 미래를 만들어가고 있는 데이터 분석의 힘! 다양한 데이터 포 굿 노력의 결과를 확인해보세요!





저자

스티브 멜그렌(Steve Mellgren) l 수석 솔루션 아키텍트(Sr Solutions Architect)


편집

SAS코리아 마케팅