지난 글(원본글들)
1편: 조선족이 조직적으로 활동하는지 기록할 댓글 추적기 만들고 있다
3편: [3월 9일짜 8개 언론사] 차이나 게이트 댓글 조사 보고
4편: [3월 10일 10개 사이트] 차이나 게이트 댓글 조사
5편: [3월 11일 14개 사이트] 차이나 게이트 댓글 조사
6편: [3월 12일 14개 사이트] 차이나 게이트 댓글 조사
7편: [3월 13일 15개 사이트] 차이나 게이트 댓글 조사
오늘도 반갑다.
댓글이 100만개가 넘어가면서 더이상 스프레드시트로 댓글 데이터를 공유하지 못하게 됐다.
그래서 웹사이트를 하나 만들었다.
링크: 차이나 게이트 댓글 아카이브
그럼 이 사이트 사용은 어떻게 하는지 간단히 설명해보겠다.
1. 의심스러운 사용자의 활동 추적
가령 경대승이라는 사람이 요즘 의심스럽다는 제보가 많이 들어오고 있다.
이처럼 활동 내역이 수상한 사람을 검색해보면 바로 좋아요는 얼마를 받고, 해당 내용은 무엇인지 확인할 수 있다.
2. 이상한 문장 검색
몇몇의 댓글의 경우 복사 붙여넣기를 한 것 같기도하고,
조선족들을 탐색하다보면 한국인이 쓰지 않는 단어, 문법이 들어가있기도 할 것이다.
검색 옵션에서 내용으로 검색하면 된다.
3. 링크 추적
트위터에 좌표가 찍힌 곳이 있다면 해당 링크에 달린 댓글을 빠르게 확인할 수 있다.
물론 이 댓글 아카이브는 말 그대로 아카이브라 지금 방금 올라온 뉴스 기사들에 대해선 대응하지 못한다.
그렇기 때문에 우갤 증거 저장소 등을 보거나 과거에 스크린샷을 통해 추적에 사용하면 좋을 것이다.
# 앞으로 조사 방향
현재는 다음 댓글만 아카이브에서 제공하고 있다.
이 점을 대폭 확대해 한국 메이저 커뮤니티 대다수를 크롤링해서, 닉네임 교차 검증을 제공할 것이다.
또한 과거 댓글을 계속해서 가져와 적어도 2월 ~ 4월 총선 전까지의 데이터를 제공하려고 한다.
마지막으로 트위터에서 발생하는 트윗과 댓글간의 상관 관계를 입증하는데 노력하고 있다.
# 조선족은 언제 잡나?
해당 부분은 공개하지 않고 진행 중이다.
* 뭔가 유의미한 데이터는 확보했는가?
2~3월 중 약 40일간의 댓글을 모은 게 140만개 정도 된다. 정치, 사회, 경제 면에서만 댓글을 가져오고 있는데, 하루 평균 3~4만개이다.
이 과정에서 가장 많이 댓글을 쓴 사람은 몇 개일까?
그렇게 많지 않았다. 전체 댓글을 쓴 사람 수는 무척 많았지만, 대다수가 수 개 ~ 수 십 개 사이였고, 100개를 넘게 작성한 사용자는 고작 2명.
닉네임 "소나무"와 닉네임 "하늘" 뿐이었다.
현재까지 데이터만 봐서는 특정 세력이나 특정 계정이 미친듯이 댓글을 달았다고 절대 볼 수 없고, 그런 자료도 없다.
그럼에도 왜 우리 눈에는 여론 조작 세력이 많은 것처럼 보일까?
이유는 바로 댓글의 수가 아니라 좋아요 수 때문이다.
다음 댓글 전체를 친정부와 반정부로 나눠서 살펴보면 반정부 의견도 꽤 많다는 사실을 발견할 수 있다.
그러나 좋아요 숫자에서 유의미하게 친정부가 높다.
굉장히 놀라운 사실이다.
이 점에 착안한다면 여론 조작 세력이 있다면 그건 친정부일 것이고,
그들의 행동 양상은 댓글 작성이 아닌 좋아요와 싫어요이다.
오늘 발견한 이 증거를 바탕으로 앞으로 조사 방향을 정하고자 한다.
다른 분들도 좋아요와 싫어요를 유도하는 글(역따 같은 거)과
그리고 이상하리만치 좋아요를 항상 많이 받는 사람들 위주로 조사하는 걸 추천하고 싶다.
부적: http://dongtaiwang.com/loc/phome.php?v=0