소품집

소셜네트워크 분석 본문

Web crawling

소셜네트워크 분석

sodayeong 2020. 6. 19. 04:06

내 담당은 분석이다

 

 

www.notion.so/dayeong1021/Social-Network-4a7041b2896b4f0789e1232ee65816d0

 

(박소윤) Social Network 시각화

데이터 확인

www.notion.so

 

 


* 팀 : 박소윤 (박ㄱㅎ 소다영 윤ㅅㅇ 줄임이다 재밌죠,,,)
* Social Network 시각화
* 수치분석은 notion link 참조해주세요

# 1. drama (드라마)
## a_drama
위 그래프를 보면 중앙에 두 개의 큰 응집성 집단을 확인할 수 있다.
또한 외각을 둘러싼 바운더리도 확인된다. 

## d_dramad
위 그래프를 보면 중앙에 위치한 집단은 배우와 감독의 결합으로 구성된 연결망이다. 
중앙의 응집성이 큰 것을 보아 둘의 결합이 높은 것을 확인할 수 있다.
또한 외곽 좌우에도 바운더리가 조밀하게 구성되어 있는 것을 확인할 수 있다. 

### a_drama & d_dramad network

- vcount : vertecx의 수가 d_dramad를 결합했을 때 늘어난 것을 보여준다. -> 정보 공유가 활발해짐. 공유할 정보가 늘어남.
- ecount : edge(links)는 d_dramad를 결합했을 때 줄어드는 것으로 확인 되는데, centr이 강해져 약한 edgs가 과감하게 생략된 것으로 보인다. 
- density : a_drama에 d_drama를 추가하면 관계망의 밀도가 커지는 것으로 확인된다.
 
- centr : 중앙에는 highest eigenvector centrality가 높게 나타나며, 그래프를 구축하는 큰 축이 되는 것으로 확인된다.
   - 조밀하고 연결성이 높은 네트워크 파악되며 흐름성(=정보량)이 많을 것으로 파악된다. 
      - 또한 중앙성과, 양 옆의 클러스터 형태의 노드 응집성이 강하게 보이는데, 배우와 감독의 조합이 크게 변화지 않는 drama 장르가 고인물 장르인 것 같다.
- triad_003 & triad_201 : 3명이 구성되어 있는 모양으로 전체 네트워크를 살펴보자면, 
                    003: a_drama -> d_drama로 보면, 약 4배정도 증가한 것으로 확인된다. 이 이유 또한 ecount의 이유와 비슷한 맥락이라 예상한다. 
                    201: a_drama -> d_drama로 보면, 약 1.5배 줄어드는 것으로 확인된다. 배우&배우 결합보다 배우&감독의 결합의 쌍이 전자보다 결합(=인맥이 될 수 있는..)될 수 있는 확률이 더 작아지기 때문이다.
                    
- dayad_mut(상호 연결이 있는 쌍의 수) : 이 수치는 density와 cnetr의 연관관계가 높다. 시각자료를 참고하여 보더라도 연결이 있는 쌍의 수 -> 중앙밀도가 높아지는 것을 확인할 수 있다.  
- dayad_null(연결이 없는 쌍의 수) : a_drama -> d_drama로 변화하는 연결망을 확인해보면, 연관이 없는 네트워크는 과감하게 외곽으로 빠지게 됨


# 2. action (액션)
## a_action 
위 그래프를 보면 중앙에 한 개의 큰 응집성 집단을 확인할 수 있다. 
또한 외각 좌우에도 (중앙보단 아니지만) 조밀한 응집성을 갖은 두 집단도 확인된다.
특이한 점은 하단의 집단인데, 외톨이 집단으로 보여도 결국엔 외각의 노드와 연결된 링크를 갖고있는 것이다. 

## d_action 
위 그래프를 보면 중앙에 위치한 집단은 배우와 감독의 결합으로 구성된 연결망이다. 
중앙의 응집성이 큰 것을 보아 둘의 결합이 높은 것을 확인할 수 있다.
또한 외곽 바운더리도 조밀하게 구성되어 있는 것을 확인할 수 있다. 
특히 외곽 바운더리에는 021(*) triad 형태가 확인된다. (*은 C, D, U로 생각되어짐.)

### a_action & d_action network

- vcount : vertecx의 수가 d_action을 결합했을 때 늘어난 것을 보여준다. -> 정보 공유가 활발해짐. 공유할 정보가 늘어남.
- ecount : edge(links)는 d_action을 결합했을 때 줄어드는 것으로 확인 되는데, centr이 강해져 약한 edgs가 과감하게 생략된 것으로 보인다.
- density : a_action에 d_action을 추가하면 관계망의 밀도가 커지는 것으로 확인된다.

- centr : 중앙에는 highest eigenvector centrality가 높게 나타나며, 그래프를 구축하는 큰 축이 되는 것으로 확인된다.
   - 조밀하고 연결성이 높은 네트워크 파악되며 흐름성(=정보량)이 많을 것으로 파악된다. 
      - 또한 중앙에는 노드 응집성이 강하게 보이는데, action 장르 또한 배우와 감독의 조합이 크게 변화지 않는 고인물 장르인 것 같다.
      
- triad_003 & triad_201 : 3명이 구성되어 있는 모양으로 전체 네트워크를 살펴보자면,
                    003: a_action -> a_action로 보면, 약 3.9배정도 증가한 것으로 확인된다. 이 이유 또한 ecount의 이유와 비슷한 맥락이라 예상한다. 
                    201: a_action -> a_action로 보면, 약 2.7배 줄어드는 것으로 확인된다. 배우&배우 결합보다 배우&감독의 결합의 쌍이 전자보다 결합(인맥이 될 수 있는..)될 수 있는 확률이 더 작아지기 때문이다.

- dayad_mut(상호 연결이 있는 쌍의 수) : 이 수치는 density와 cnetr의 연관관계가 높다. 시각자료를 참고하여 보더라도 연결이 있는 쌍의 수 -> 중앙밀도가 높아지는 것을 확인할 수 있다.  
- dayad_null(연결이 없는 쌍의 수) : a_drama -> d_drama로 변화하는 연결망을 확인해보면, 연관이 없는 네트워크는 과감하게 외곽으로 빠지게 됨



# 3. melo (멜로)
## a_melo
위 그래프를 확인해보면 크게 세 가지의 군집으로 구성되어 있는 것을 확인할 수 있다. 
앞서 봐왔던 drama와 action 장르와는 다르게 중앙밀도에 집중되기 보다는 외각 군집에 집중되어 있는 것을 확인할 수 있다. 
특히 triad 201과 300이 많이 보이며, 상호호헤성이 큰 것을 확인할 수 있다. 

## d_melo
중앙에도 세 개의 군집이 응집된 것을 확인할 수 있다. 
감독 네트워크를 추가하니, a_melo에서보다 중앙으로 응집된 것을 확인할 수 있다. 
triad201은 여전히 많이 확인되어짐.


### a_melo & d_melo network

- vcount : vertecx의 수가 d_melo를 결합했을 때 늘어난 것을 보여준다. -> 정보 공유가 활발해짐. 공유할 정보가 늘어남.
- ecount : edge의 수가 d_melo를 결합해도, 크게 늘어나진 않는 것으로 확인했다. 
- density : a_melo에 d_melo을 추가하면 관계망의 밀도가 작아지는 것으로 확인된다.
         a_melo에서는 크게 세 가지 군집으로 구성되어 있다고 했는데, d_melo에서는 하나의 군집으로 이루어져있다.
         예상컨대 a_melo에서는 세 군집 사이에 상호결합이 크지 않았고, 여기에 d_melo 네트워크를 추가하다 보니 이런 연결망이 형성된 것 같다. 
                                          (+ 그리고 결합된 연결망도 중앙에 세 개의 군집으로 나눠지는 것이 확인된다.)
         

- centr : 중앙에는 highest eigenvector centrality가 높게 나타나며, 그래프를 구축하는 큰 축이 되는 것으로 확인된다.
   - 조밀하고 연결성이 높은 네트워크 파악되며 흐름성(=정보량)이 많을 것으로 파악된다. 

- triad_003 & triad_201 : 3명이 구성되어 있는 네트워크를 살펴보자면,
                    003 : a_melo -> d_melo로 보면, 약 4배정도 증가한 것으로 확인된다.
                    201 : a_melo -> d_melo로 보면, 2개의 쌍이 3,000개 늘어난 것을 확인할 수 있다.
                        d_melo에서 중앙에 응집될수록 2개의 쌍을 이루는 네트워크가 늘어난 것을 확인할 수 있었고,상호결합이 커진것으로 확인된다. 

- dayad_mut (상호 연결이 있는 쌍의 수) : 위 그래프에서도 확인할 수 있듯이, 2개의 쌍을 이룬 triad 형태가 많이 확인되어짐
                         melo 장르에서 배우&감독은 상호결합(1:1)많이 확인 되는 것을 뒷받침할 수 있음
                         배우&감독의 결합이 지속적으로 이루어져, 중앙밀도가 높은것을 확인할 수 있음         
- dayad_null (연결이 없는 쌍의 수) :  a_melo -> d_melo 변화하는 연결망을 확인해보면, 연관이 없는 네트워크는 과감하게 외곽으로 빠지게 됨

 

 

 

728x90
Comments