Chapter 3. 소셜네트워크 데이터의 수집 봅시다

>

소셜 네트워크 분석은 분석에 사용하는 네트워크의 유형에 따라 두 가지로 나뉜다. 첫 번째로, “전체 네트워크 연구 설계”이다. 네트워크 전체의 연구설계에서는, 모든 액터대간의 연결 관계를 대상으로 연구를 실시한다. 예를 들어 기업 내 일부 부서에서 누가 누구의 친구인지를 조사하고 이를 분석에 활용한다. 두 번째로, “에고 네트워크 연구 설계”이다. 주분석 대상 액터의 집합을 에고라고 부르며, 에고와 연결되어 있는 다른 액터인 “알터”와의 관계 데이터가 수집된다. 이러한 연구의 목적은 이기주의 각각의 사회적 환경을 이해하는 것이다.(에고간의 연결관계, 알터들간의 연결관계는 파악하고 있지 않다.) 대부분의 네트워크 해석은 “전체 네트워크”를 가정한다. 이러한 연구 설계를 채용하면, 거의 모든 네트워크 지표나 분석 수법을 활용할 수 있기 때문이다. 그러나, 네트워크 사이즈가 커지면, 데이터 수집에 드는 코스트가 기하 급수적으로 증가한다. 따라서 연구 대상이 되는 액터의 수가 커지면 설문 문항을 축소해야 할 가능성도 있다. 이것으로부터, 에고 네트워크 연구 설계는, 액터와 인접하는 주변의 네트워크 환경을 풍부하고 상세하게 데이터를 분석할 수 있다.

네트워크 데이터는 2가지 방식으로 수집할 수 있다. 첫째, 1차 정보원은 연구자가 사람을 직접 설문과 인터뷰를 통해서 그들의 행동을 관찰하는 것이다. 둘째, 2차 정보원은 연구자가 직접 만드는 것은 없지만 누군가에 의해서 이미 만들어져서 어딘가에 이미 존재하는 데이터를 분석하는 것이다. 예를 들면 종이 문서(편지 기록물), 디지털 문서(전자 메일, )등으로서 존재하고 인용 데이터, 멤버쉽 데이터, 소셜 미디어 데이터 등의 관련 데이터로서 존재하는 경우도 있다. ​ 1. 설문 조사: 다른 사람들과의 연결 관계에 대한 질문이 주로 이뤄졌으며 또 다른 사람들과 특정 관계의 유형을 파악할 때 사용된다. 예를들어누구를좋아하는지,누구를싫어하는지,누구와대화를하는지등질문을한다. 배우가 개인이 아니라 집단일 때도 사용되는 것이 있지만, 예를 들면, 어느 회사를 대표하는 개인이 집단의 연결 관계에 대해서 답변을 한다. ​ 2. 인터뷰:인터뷰는 명, 면 또는 전화를 통하여 이루어질 수 있다. 에고 네트워크의 응답자로부터 네트워크 데이터를 수집할 때에 주로 사용된다. 설문의 방법과 내용은 비슷하겠지만 대면한다는 점만 다르다. ​ 3. 관찰:배우 사이에 상호 작용(연결 관계)가 존재할 경우 이를 관찰하고 데이터를 수집한다. 데이터 수집은 상대적으로 소규모 집단을 연구할 때 활용된다. 관찰을 실시해 네트워크 데이터를 수집하기 위해서는 사람들 간의 다양한 상호작용을 코딩할 수 있는 일관되고 명료한 방법이 필요하다. 무엇을 상호작용이라고 정의할 것인가를 결정해야 한다. 함께 활동하는 것, 서로 대화하는 것, 함께 노는 것 등을 상호작용으로 볼 것인지를 명확히 정의해야 한다. 상호 작용의 횟수 또는 시간을 기록함으로써, 형태를 관찰할 수 있다. ​ 4. 기록 문서/데이터베이스 이건 이미 수집된 데이터이기 때문에 데이터 수집에 드는 비용이 싸고, 정보 제공자의 시간과 노력에 대한 부담 없이 일정 기간마다 축적된 데이터는 고품질의 시계열적 정보를 제공한다는 장점이 있다. 예로는 서한, 특허인용, 책, 논문, 참고문헌, 신문, 회의록, 역사기록물, 인터넷 사이트, 이메일, 포스팅 등 다양한 형태를 가진다.

소셜 네트워크 분석을 할 때는 분석 대상에 어떤 액터를 포함할지를 결정해야 한다. 즉 분석의 목표가 되는 모집단에서 분석을 하는 표본을 결정하는 것이라고 할 수 있다. 이와 같이 액터간의 관계 데이터의 수집 범위를 정하는 것을 경계 설정이라고 한다.에고 네트워크의 경우 설문조사를 할 때와 마찬가지로 모집단에서 원하는 수만큼 에고를 무작위로 추출해 수집하면 된다.이기주의 표본이 결정되면 이들 응답자로부터 이기주의 네트워크 데이터를 각각 수집하면 된다. 위에서도 말해 왔지만, 에고 네트워크는 에고 액터간의 연결 관계를 나타내지 않기 때문에, 전체의 네트워크 분석에는 이용할 수 없다. 그리고, 에고 네트워크에 포함되는 아르타 액터의 수를 결정하는 등, 추가의 경계 설정을 해야 한다.네트워크 전체의 경우 경계는 특정 연구 문제와 관련된 모든 액터가 포함되는 완전한 액터 집합을 의미하기 때문에 경계 설정은 연구의 모집단을 결정하는 것과 동의일 가능성이 있다. 예를 들어 실리콘밸리 벤처기업의 모든 구성원을 들 수 있다. 그러나 모집단이 지나치게 커지면 네트워크의 경계 설정이 아예 불가능해질 수도 있다. 네트워크 분석을 실시할 때에는, 연구 문제를 잘 설정해, 집단내의 액터만으로 네트워크의 경계 설정을 실시할 것인지, 혹은 집단외의 액터도 네트워크의 경계에 포함시킬지를 결정할 필요가 있다.

네트워크 전체의 분석은 경계를 결정하는 것이 연구 문제와 밀접한 관련을 가진다. 이 과정에서 나타나는 어려움을 해결하기 위해서 네트워크 경계 설정을 위한 다양한 방법이 제시됐다. ​ 1. 사실주의 접근:사회적으로 실존하는 집단을 대상으로 네트워크의 범위를 결정한다. 네트워크는 액터가 경험적으로 알고 있는 경계에 대해서 주관적인 인식에 근거해 네트워크 경계설정을 실시한다. 그 때문에, 목표 모집단을 대표하는 핵심 정보 제공자의 인지를 파악하는 것이 중요하다. 한 무리의 내부 네트워크 분석 때는 사실주의의 어프로치에 의한 집단의 내부와 외부를 구분하는 네트워크의 경계 설정을 확실히 할 중요하다. ​ 2. 명목 주의 접근:연구자가 도입된 개념적 틀에서 도출한 액터의 집합을 네트워크의 경계를 설정한다. 예를 들면 특정 주제에 관한 연구를 하는 학자들의 소셜 네트워크를 분석하기 때문에 최근 5년 동안 그 주제에 관한 논문을 발표한 학자들의 모임과 네트워크 경계 설정을 하는 것이다. 연구자는 이론적 근거에 의해서 개념적 체제를 설정해야 하며 네트워크 경계 설정의 근거를 정당화할 수 있어야 한다. ​ 3. 지위 접근:지위는 특정한 역할과 권한, 기능과 관련한 사회적 위치를 의미한다. 지위접근법은 연구목적에 따라 연구하는 “지위”를 식별하고 사회구조 속에서 유사한 지위를 가진 액터들의 집합을 도출하는 방식으로 네트워크의 경계설정을 하는 것이다. 연구자는 특정 지위를 포함하거나 배제하는 데 명확한 이유를 제시하고 정당성을 제시해야 한다. ​ 4. 관계 접근:네트워크 내에 포함되는 배우를 선정하기 때문에 그 네트워크를 잘 알고 있는 정보 제공자를 이용하는 것이다. – 명성법: 연구 대상이 되는 네트워크를 가장 잘 아는 정보 제공자나 전문가에게 액터를 지지 않도록 요청한 후 식별된 액터를 이용해 네트워크 경계를 설정하는 것이다. 이것은 모든 액터가 열거된 명단이 존재하지 않는 경우에 이용할 수 있다. 연구자는 자신이 선택한 제보자에게 신뢰성이 있다는 이론적, 실증적 근거를 제시할 수 있어야 한다. 스노우볼 샘플링법: 소수의 액터를 선정하고 이들이 관계를 맺는 다른 액터를 지명할 것을 요청한다. 이런 식으로 반복해서 추가되는 액터가 없을 때까지 하는 것이다. 지명 단계가 계속될 때마다 강하게 연결된 네트워크가 도출된다. 예를 들어 마약판매업자나 불법체류자 등 모집단의 구성원을 찾을 때 특히 유용하다. 연구자들이 처음으로 선정하는 배우 집합의 역할이 매우 중요하다. ​ 5. 이벤트 접근:특정 시간과 장소에서 발생하는 이벤트에 참가하는 배우에서 네트워크 경계를 설정하는 것이다. 그 경우는 이벤트를 적절히 카테고라이즈하는 것이 중요하며, 이벤트 선정의 명확한 근거를 제시해야 한다. 또한 여러 이벤트를 이용하여 모든 이벤트 참여자를 종합하면 포괄적이고 종합적인 네트워크를 생성할 수 있다.

연구 목적이나 연구 환경에 응하고 소셜 네트워크 분석에 필요한 자료를 다양한 방법이나 순서에 의해서 수집할 수 있다. ​ 1. 소시오 메트리:설문지 법과 인터뷰를 통해서 네트워크 구성원 상호 간에 네트워크 구조를 이해하는 것이다. 네트워크 구성원 상호간의 선택관계/비선택관계를 파악하고 네트워크 구조를 이해하는 것이다.​ 1)단일 관계/다중 관계:​ ​ 한개의 관계를 이용한 설문은 하나의 관계 유형에 대한 데이터를 수집하는 것이다. 반면 다중관계를 이용한 설명은 여러 관계 유형에 대한 데이터를 수집하는 것이다.​ 2)명단/자유 회상:데이터를 수집할 때에는 각각의 응답자에게 연구 대상이 되는 모든 배우의 이름이 포함된 명단을 제공할 수도 있어 다른 명단을 제공하지 않는 자유 회상 방식도 있다.​ 3)고정 선택/자유 선택:앙케트나 인터뷰를 통해서 응답자가 열거하는 사람들을 모두 허용하면 자유 선택, 열거하는 사람들의 수를 제한하면 고정 선택이라고 한다. 고정선택을 하면 데이터 추출과정이 단순해지기 때문에 응답자의 부담이 줄어든다. 또 시간과 자원에 한계가 있다면 응답자의 액터 수에 제한을 둬야 할 것이다.하지만 고정 선택 방식에 비판의 시선도 있지만 그 이유는 모든 응답자가 정해진 순서의 알터로 구성된 소셜 네트워크를 갖고 있는 것은 아니기 때문이다.​ 4)절대 평가/상대 평가:응답자가 배우 간 연결 관계에 대해서 절대적인 척도로 표은카가프를 부여하는 일은 절대 평가이며, 응답자가 배우와의 연결 관계를 상대적 순위를 정해서 표은카가프를 부여하는 일은 상대 평가이다.​ 2. 인지 사회 구조:네트워크 내에 포항도에은액타ー 간 모든 관계, 각 개인이 지각하는 모든 사람들과의 관계를 인지 사회 구조라고 한다. 각 응답자에게 각 행위자의 연결 관계에 대한 주관적인 생각을 대답해 주면, 이러한 네트워크 데이터를 얻을 수 있다. 간단히 예를 들면 다음과 같다.설문지 각 페이지에 전 직원 명단이 제공된다. 응답자는 A가 친구라고 생각하는 사람을 명단에 표시한다. 그 다음 B가 친구라고 생각하는 사람을 명단으로 표시하는…-사람 이름이 줄과 줄처럼 늘어선 정사각형 매트릭스를 제공한다. 응답자가 줄에 열거하는 자가 열에 열거하는 자를 친구로 생각하면 해당 셀에 ○인을 하게 한다.만약 N명의 액터로 이루어진 네트워크로부터 데이터를 얻으면, 합계 N개의 인지 맵이 구성될 것이다. 그리고 이것은 N개의 액터로 구성된 소시오그램으로 표현되거나 N*N 소시오매트릭스로 표현될 것이다. 액터는 자신의 연결관계뿐만 아니라 다른 액터의 연결관계까지 수집하기 위해 많은 데이터를 제공한다. 이 때문에, 인지 사회 구조 데이터의 수집은, 지극히 작은 네트워크의 분석에서 주로 활용된다.

>

인지사회구조데이터는 두 가지로 활용할 수 있다. 첫째, 참가자에 의해서 지각된 네트워크간의 구조의 일치 정도를 평가할 수 있다. 이 경우 유사한 속성을 갖는지, 유사한 관계적 패턴을 가진 사람 사이에 일치 정도가 높은지가 관심사다. 둘째로, 일정한 기준에 비해 지각한 네트워크 구조의 편향 정도를 평가할 수 있다. 특정 정보 제공자가 지각한 네트워크 접속 관계의 정확성의 정도를 파악할 수 있다. 이는 응답자의 보고적 대답으로부터 발생하는 “체계적인 인지 미스”파악에 도움이 된다. ​ 3. 사회 인지 매핑과 카드 분류 1)사회 인지 매핑:응답자의 주관적 판단에 의해서 네트워크 내의 모든 사람들과의 관계 데이터를 수집하는 것이다. 우선 응답자에게 설문을 실시하고, 먼저 집단에 대한 주관적인 견해를 추출한 뒤 이를 바탕으로 사람들과의 관계를 자유 회상 방식으로 도출한다. 예를 들어, 같이 있는 사람 있어요? 그들은 누구입니까?하는 식으로 물어보는 것이다. 이 방식으로 추출한 데이터는, 어느 사람이 어느 그룹에 속하는지를 나타내는 2분 매트릭스를 구성해, 각 액터가 만든 2분 매트릭스를 결합하면, 전체 네트워크에서의 통합한 관계를 도출할 수 있다.​ 2)카드 분류:각 응답자들에 배우의 이름이 포함된 카드를 제공하고 서로 잦은 접촉이 있는 사람끼리 묶어 서로 중복되지 않은 카드 뭉치를 만들고 있다. 하면, 어떤 사람이 어느 그룹에 속하는지를 나타내는 이분 매트릭스를 구성할 수 있고 각 액터들이 만든 두분 매트릭스를 결합하면 전체 네트워크로 통합한 관계를 도출할 수 있다. ​ 4. 이름 생성기와 이름 해결기:이 둘은 주로 에고 네트워크 분석에서 활용된다. 연구자는 2단계 앙케이트를 실시해, 이기적으로 알터간의 관련 정보를 수집한다. 응답자 중심의 정보 제공자로서 하지만 그를 둘러싼 이기주의 네트워크 데이터를 제공하기 위해 알터와의 설문조사나 인터뷰는 이루어지지 않고 있으며 연구자는 이름 생성기와 이름 해석기로부터 데이터를 수집해 다양한 이기주의 네트워크 속성을 분석한다.​ 1)이름 생성기:이름 생성기는 응답자의 이기주의 네트워크를 구성하는 알 도를 식별하고 네트워크의 경계를 설정한다. 일반적인 절차는 우선 각 응답자가 자유회상 방식으로 자신과 특정 연결관계를 맺은 사람을 제시하도록 하고 제시된 사람들에 대한 속성 정보를 제공하도록 한 뒤 응답자와 그가 제시한 사람들과의 관계에 대해 응답하도록 한다. 즉 에고의 알터들, 알터간의 관계, 에고와 알터의 관계 정보를 수집하는 것이다. 알터의 이름 식별을 위해 한 개의 설문 항목에 의존하여 한 개의 관계만을 조사하면 ‘단일 이름 생성기’, 여러 개의 설문 항목에 의존하여 여러 가지 관계를 조사하면 ‘다중이름 생성기’라고 한다. 응답자가 말하는 알터 수에 제한을 가하기도 한다(고정 선택), 아무런 제한을 두지 않기도 있다(자유 선택). ​ 2)이름 해석기:이름 생성기를 통해서 응답자의 이기주의 네트워크에 대한 경계가 확정되면 알 스커트에 이기주의 네트워크 구조에 관한 정보를 수집한다. 질문의 유형은 크게 3가지다. 첫번째로, 알터의 속성(성별, 연령, 인종, 교육 수준등)에 대해 조사한다. 둘째, 이기심과 알터 사이의 연결관계의 특성(정서적 가까움, 불편함 정도, 접촉빈도, 친분이 있는 기간 등)을 조사한다. 셋째, 알터간의 관계를 조사한다.​ 5. 지위의 생성기와 자원의 생성기:이름 생성기처럼 이기심과 연결된 알터 집합을 추출하는데 이기심의 주변에 어떤’유형’의 사람이 있는지를 추출하는 것이다.​ 1)지위의 생성기:응답자와 만날 도가 지닌 사회적 지위와 관계를 측정한다. 다양한 수준의 사회경제적 평판을 갖고 있는 직업적 지위와의 연결관계를 평가하는 것이다. 예를 들어 응답자에게 사회적 지위 리스트를 제공하고, 개인적 친분이 있는 사람들 중 특정한 사회적 지위를 가지고 있다면 이름을 쓰도록 요청한다.2)자원의 생성기:응답자가 특정 자원을 확보하거나 특정의 도움을 받기 위해서 필요한 사람을 알고 있는지를 조사하는 것이다.