by 노성산, 샌드박스 DataLab Lead

1. 사건의 발단

샌드박스 DataLab 에서 트렌드 분석을 위해 유튜브 채널들을 분류하고 있는데, 주관적인 부분도 많고 새로운 트렌드가 계속 생기다보니 어려움이 많다. 왠지 유튜브 추천 시스템을 역이용하면 쉽게(?) 분류 자동화가 가능할 것 같아 사이드 프로젝트로 가볍게 진행해 보았다.

2. 삽질의 시작

채널 리스트 뽑고 → 추천 데이터 긁어와서 → 시각화툴에 던져보면 쉽게 될 것 같았는데, 생각보다 다양한 장애물이 존재했다.

NodeXL로 뽑은 10만 구독자 이상 채널 전체 관계도. 유사 채널별로 그룹을 생성하니 색으로 구분해 준다. 한 번에 이렇게 뽑은 건 아니고 약 7번의 삽질이 필요했다.

NodeXL로 뽑은 10만 구독자 이상 채널 전체 관계도. 유사 채널별로 그룹을 생성하니 색으로 구분해 준다. 한 번에 이렇게 뽑은 건 아니고 약 7번의 삽질이 필요했다.

3. 결과물 공유. share요