일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- KT AIVLE
- httr
- python
- 딥러닝
- 시계열
- 한국전자통신연구원 인턴
- dx
- kt aivle school
- 하둡
- 가나다영
- ML
- 에이블러
- 한국전자통신연구원
- ggplot2
- KT 에이블스쿨
- 지도학습
- 다변량분석
- 시각화
- kaggle
- 소셜네트워크분석
- Eda
- 프로그래머스
- ETRI
- 기계학습
- hadoop
- SQLD
- 에트리 인턴
- 에이블스쿨
- 빅분기
- r
- SQL
- cnn
- arima
- 빅데이터분석기사
- 머신러닝
- 하계인턴
- matplot
- 웹크롤링
- 서평
- Ai
- Today
- Total
소품집
소셜네트워크 분석 본문
내 담당은 분석이다
www.notion.so/dayeong1021/Social-Network-4a7041b2896b4f0789e1232ee65816d0
* 팀 : 박소윤 (박ㄱㅎ 소다영 윤ㅅㅇ 줄임이다 재밌죠,,,)
* Social Network 시각화
* 수치분석은 notion link 참조해주세요
# 1. drama (드라마)
## a_drama
위 그래프를 보면 중앙에 두 개의 큰 응집성 집단을 확인할 수 있다.
또한 외각을 둘러싼 바운더리도 확인된다.
## d_dramad
위 그래프를 보면 중앙에 위치한 집단은 배우와 감독의 결합으로 구성된 연결망이다.
중앙의 응집성이 큰 것을 보아 둘의 결합이 높은 것을 확인할 수 있다.
또한 외곽 좌우에도 바운더리가 조밀하게 구성되어 있는 것을 확인할 수 있다.
### a_drama & d_dramad network
- vcount : vertecx의 수가 d_dramad를 결합했을 때 늘어난 것을 보여준다. -> 정보 공유가 활발해짐. 공유할 정보가 늘어남.
- ecount : edge(links)는 d_dramad를 결합했을 때 줄어드는 것으로 확인 되는데, centr이 강해져 약한 edgs가 과감하게 생략된 것으로 보인다.
- density : a_drama에 d_drama를 추가하면 관계망의 밀도가 커지는 것으로 확인된다.
- centr : 중앙에는 highest eigenvector centrality가 높게 나타나며, 그래프를 구축하는 큰 축이 되는 것으로 확인된다.
- 조밀하고 연결성이 높은 네트워크 파악되며 흐름성(=정보량)이 많을 것으로 파악된다.
- 또한 중앙성과, 양 옆의 클러스터 형태의 노드 응집성이 강하게 보이는데, 배우와 감독의 조합이 크게 변화지 않는 drama 장르가 고인물 장르인 것 같다.
- triad_003 & triad_201 : 3명이 구성되어 있는 모양으로 전체 네트워크를 살펴보자면,
003: a_drama -> d_drama로 보면, 약 4배정도 증가한 것으로 확인된다. 이 이유 또한 ecount의 이유와 비슷한 맥락이라 예상한다.
201: a_drama -> d_drama로 보면, 약 1.5배 줄어드는 것으로 확인된다. 배우&배우 결합보다 배우&감독의 결합의 쌍이 전자보다 결합(=인맥이 될 수 있는..)될 수 있는 확률이 더 작아지기 때문이다.
- dayad_mut(상호 연결이 있는 쌍의 수) : 이 수치는 density와 cnetr의 연관관계가 높다. 시각자료를 참고하여 보더라도 연결이 있는 쌍의 수 -> 중앙밀도가 높아지는 것을 확인할 수 있다.
- dayad_null(연결이 없는 쌍의 수) : a_drama -> d_drama로 변화하는 연결망을 확인해보면, 연관이 없는 네트워크는 과감하게 외곽으로 빠지게 됨
# 2. action (액션)
## a_action
위 그래프를 보면 중앙에 한 개의 큰 응집성 집단을 확인할 수 있다.
또한 외각 좌우에도 (중앙보단 아니지만) 조밀한 응집성을 갖은 두 집단도 확인된다.
특이한 점은 하단의 집단인데, 외톨이 집단으로 보여도 결국엔 외각의 노드와 연결된 링크를 갖고있는 것이다.
## d_action
위 그래프를 보면 중앙에 위치한 집단은 배우와 감독의 결합으로 구성된 연결망이다.
중앙의 응집성이 큰 것을 보아 둘의 결합이 높은 것을 확인할 수 있다.
또한 외곽 바운더리도 조밀하게 구성되어 있는 것을 확인할 수 있다.
특히 외곽 바운더리에는 021(*) triad 형태가 확인된다. (*은 C, D, U로 생각되어짐.)
### a_action & d_action network
- vcount : vertecx의 수가 d_action을 결합했을 때 늘어난 것을 보여준다. -> 정보 공유가 활발해짐. 공유할 정보가 늘어남.
- ecount : edge(links)는 d_action을 결합했을 때 줄어드는 것으로 확인 되는데, centr이 강해져 약한 edgs가 과감하게 생략된 것으로 보인다.
- density : a_action에 d_action을 추가하면 관계망의 밀도가 커지는 것으로 확인된다.
- centr : 중앙에는 highest eigenvector centrality가 높게 나타나며, 그래프를 구축하는 큰 축이 되는 것으로 확인된다.
- 조밀하고 연결성이 높은 네트워크 파악되며 흐름성(=정보량)이 많을 것으로 파악된다.
- 또한 중앙에는 노드 응집성이 강하게 보이는데, action 장르 또한 배우와 감독의 조합이 크게 변화지 않는 고인물 장르인 것 같다.
- triad_003 & triad_201 : 3명이 구성되어 있는 모양으로 전체 네트워크를 살펴보자면,
003: a_action -> a_action로 보면, 약 3.9배정도 증가한 것으로 확인된다. 이 이유 또한 ecount의 이유와 비슷한 맥락이라 예상한다.
201: a_action -> a_action로 보면, 약 2.7배 줄어드는 것으로 확인된다. 배우&배우 결합보다 배우&감독의 결합의 쌍이 전자보다 결합(인맥이 될 수 있는..)될 수 있는 확률이 더 작아지기 때문이다.
- dayad_mut(상호 연결이 있는 쌍의 수) : 이 수치는 density와 cnetr의 연관관계가 높다. 시각자료를 참고하여 보더라도 연결이 있는 쌍의 수 -> 중앙밀도가 높아지는 것을 확인할 수 있다.
- dayad_null(연결이 없는 쌍의 수) : a_drama -> d_drama로 변화하는 연결망을 확인해보면, 연관이 없는 네트워크는 과감하게 외곽으로 빠지게 됨
# 3. melo (멜로)
## a_melo
위 그래프를 확인해보면 크게 세 가지의 군집으로 구성되어 있는 것을 확인할 수 있다.
앞서 봐왔던 drama와 action 장르와는 다르게 중앙밀도에 집중되기 보다는 외각 군집에 집중되어 있는 것을 확인할 수 있다.
특히 triad 201과 300이 많이 보이며, 상호호헤성이 큰 것을 확인할 수 있다.
## d_melo
중앙에도 세 개의 군집이 응집된 것을 확인할 수 있다.
감독 네트워크를 추가하니, a_melo에서보다 중앙으로 응집된 것을 확인할 수 있다.
triad201은 여전히 많이 확인되어짐.
### a_melo & d_melo network
- vcount : vertecx의 수가 d_melo를 결합했을 때 늘어난 것을 보여준다. -> 정보 공유가 활발해짐. 공유할 정보가 늘어남.
- ecount : edge의 수가 d_melo를 결합해도, 크게 늘어나진 않는 것으로 확인했다.
- density : a_melo에 d_melo을 추가하면 관계망의 밀도가 작아지는 것으로 확인된다.
a_melo에서는 크게 세 가지 군집으로 구성되어 있다고 했는데, d_melo에서는 하나의 군집으로 이루어져있다.
예상컨대 a_melo에서는 세 군집 사이에 상호결합이 크지 않았고, 여기에 d_melo 네트워크를 추가하다 보니 이런 연결망이 형성된 것 같다.
(+ 그리고 결합된 연결망도 중앙에 세 개의 군집으로 나눠지는 것이 확인된다.)
- centr : 중앙에는 highest eigenvector centrality가 높게 나타나며, 그래프를 구축하는 큰 축이 되는 것으로 확인된다.
- 조밀하고 연결성이 높은 네트워크 파악되며 흐름성(=정보량)이 많을 것으로 파악된다.
- triad_003 & triad_201 : 3명이 구성되어 있는 네트워크를 살펴보자면,
003 : a_melo -> d_melo로 보면, 약 4배정도 증가한 것으로 확인된다.
201 : a_melo -> d_melo로 보면, 2개의 쌍이 3,000개 늘어난 것을 확인할 수 있다.
d_melo에서 중앙에 응집될수록 2개의 쌍을 이루는 네트워크가 늘어난 것을 확인할 수 있었고,상호결합이 커진것으로 확인된다.
- dayad_mut (상호 연결이 있는 쌍의 수) : 위 그래프에서도 확인할 수 있듯이, 2개의 쌍을 이룬 triad 형태가 많이 확인되어짐
melo 장르에서 배우&감독은 상호결합(1:1)많이 확인 되는 것을 뒷받침할 수 있음
배우&감독의 결합이 지속적으로 이루어져, 중앙밀도가 높은것을 확인할 수 있음
- dayad_null (연결이 없는 쌍의 수) : a_melo -> d_melo 변화하는 연결망을 확인해보면, 연관이 없는 네트워크는 과감하게 외곽으로 빠지게 됨
'Web crawling' 카테고리의 다른 글
[python] bs4 패키지를 이용해 네이버 날씨 crawling 연습해보기 (0) | 2021.04.05 |
---|---|
[python] Session을 활용하여 크롤링 하기 (0) | 2020.09.02 |
소셜네트워크 정의 및 igraph 패키지 사용하기 (2) | 2020.06.16 |
Selenium을 크롬에서 구동하기 - 네이버카페 크롤링 (0) | 2020.05.11 |
[웹 크롤링] 로케일에 대한 이해 (0) | 2020.04.28 |