정보공간_1

[2기 수원 이상웅] 페이스북 네트워크 분석 본문

IT 놀이터/Elite Member Tech & Talk

[2기 수원 이상웅] 페이스북 네트워크 분석

알 수 없는 사용자 2012. 11. 26. 03:08

SNA(Social Networks Analysis)

SNA는 사회 과학과 네트워크 분석 및 그래프 이론의 광범위한 분야에서 근원을 가집니다. 이러한 네트워크 분석은 네트워크 구조가 있는 문제의 정립과 해결책에 관심을 둡니다. 이러한 구조는 보통 그래프에서 포착됩니다. 다음은 페이스북을 이용하여 자신의 네트워크를 분석해보는 실습을 해보도록 하겠습니다.


NodeXL (1) 자신의 정보 가져오기

노드엑셀은 자체적으로 크롤러를 제공하지 않기 때문에, Bernie Hogan이 만든 페이스북 어플리케이션을 이용하여 자료를 수집해야 합니다. 개인의 네트워크를 얻기 위함이기 때문에 로그인이 필요하며, 보통 200명당 1분정도의 시간이 소요됩니다.

(그림1)


파일 저장 이후에는 다음과 같이 합니다.

1) 노드엑셀을 엽니다. (시작 -> 모든 프로그램 -> Microsoft NodeXL -> Excel Template)

2) 왼쪽상단 Import -> From GraphML file... -> 저장된 파일 선택

3) 왼쪽상단 prepare data -> Merge Duplicate Edges (중복 항목이 있을 경우, 정리를 해 줍니다.)


여기서 처음에 생성된 그래프는 그림2 처럼 내가 빠져있는데, 이것은 나를 빼게 될 경우 친구들의 관계를 더 잘 나타내 주기 때문입니다.

(그림2)

이것으로 끝이 아닙니다. 다양한 설정을 통해 그래프를 내 입맛대로 바꿔 나갈 수 있습니다.


NodeXL (2) 다양한 설정으로 네트워크를 분석하기

 먼저 가장 중요한 것은 목적에 맞는 레이아웃 방법을 선택하는 것입니다. 또한 레이아웃 옵션을 통해 2가지 항목을 조정할수 있는데, Iterations는 반복을 의미하며 Repulsion은 노드 사이의 저항 값을 의미합니다. 
( * Iterations * Repulsion )

(그림3)

또한 데이터에 어떠한 순위를 매겨서 네트워크를 구성할 수도 있는데, Ordered Data는 분류를 통해 나온 서열 데이터(ex. 나이, 등수)를 의미하며 Nonordered Data는 서열 없이 분류된 데이터(ex. 종교, 성별 등)를 말합니다. 클러스터링을 하기 위해선 보통 nonordered Data를 사용하셔야 합니다.

 마지막으로 분석된 네트워크를 일정 기준으로 클러스터링 하는 방법을 알아보겠습니다.
메뉴에서 Dnynamic Filters -> Groups -> Find Cluster 을 선택하시면 됩니다.

(그림4)

Gephi

NodeXL 이외에도 Gephi라는 분석 툴이 있습니다. ( https://gephi.org/ )
NodeXL 보다도 많은 기능들이 있으며, 해당 사이트에서 자세한 방법을 안내하고 있기 때문에 사용하기에도 어렵지 않습니다. 다음의 그림은 제가 직접 Gephi를 통해 나의 페이스북 네트워크를 찾고, 그 네트워크를 분석하여 그룹핑 해본 예제입니다.


참고자료 출처

이현진, 김지영, 박한우 (2010). 노드엑셀을 이용한 페이스북 네트워크 분석. 영남대학교