이번주 트위터 랭킹에 대해 얘기 나눌 기회가 있었는데,

마침
트위터에서 스패머들을 가려내는 연구에 관한 글이 발견되서, 흥미로웠다.


이 글에 대한 자세한 내용은 여기에 번역.

요약하면,
5개의 알고리즘들 비교한 결과,
Google researcher인 Daniel Tunkelang가 만든 "TunkRank"가 가장 효과적이었다는 얘기.


트윗 패턴 분석 결과,
스패머들이나 "aggressive" 마게터들의 트윗에는,
url이 들어 있거나 "earn money","weight loss","work from home"과 같은 문구들이 반복되는 경향을 보였다고.


이 연구에서 또한 following수를 감안한 follower수를 랭킹에 활용하여,
대량 following을 통한 follow back 현상을 고려하였는데,
스패머들이 잡히긴 했지만, 그만큼 일반유저들도 피해를 보더라는 결과.


내 생각.
이번주 트위터 랭킹에 대해 얘기 나눌 때 비슷한 얘기를  했었는데,
유명인들의 follwer 수는 그 수 자체가 절대적 수치를 가지고 있어서.
절대적 follower수로 트위터에서 유명인들을 골라내는 건 쉽사리 가능하겠지만,

그들은 트위터에서 정말 소수에 불과할 것이고.
그들 이외의 사람들의 랭킹에서 follower수 자체는 크게 의미 없을 것이기 때문에,
Twitter Ranking에서 그 나머지 사람들, 대다수 사람들의 ranking을 부여하는 게 관건 일 것.

following 수를 감안한 follower 수를 보는게 필요하다고 생각했는데, 역시 연구를 했네.
어떻게 감안할 지가 key 가 될 수도 있을 것 같다는 생각.

Posted by JulieNJulia
:
원문은 여기

A Better Way To Filter Twitter's Spambots? Ask Google

아래는 대략의 기사 번역 내용.

소수의 가치있는 news와 wisdom, 그리고  
대량의 nonsense와 marketing junk 가 공존하는 트위터에서 어떻게 follow할 가치있는 twitter들을 찾아낼 것인가.

스페인  Oviedo 대학의 두 교수,
Daniel Gayo-Avello 와 David Brenes가
이달 초 마드리드에서 열린 information retrieval conference 에서

계속적으로 증가하는 spammers 들과 advertisers 로부터
가치있는 microbloggers 를 골라내는(sorting) 논문을 발표했다.

단순히 follower 수만으로는 알기 어렵다.  
대량의 following 을 통한 "autofollowing"과 자신을 follow하지 않는 사람을 unfollow 함으로써, 빠르고 쉽게 Twitter authority를 조작하는 것이 가능하기 때문.

It works for some (e.g. CNN or Obama) but not for everyone (e.g. spammers).

이 두 교수는 Twitter spammers과  aggressive marketers을 분석하기 위해 8달 넘게 5백만 가량의 영어권 twitter를 분석했다.

그 결과, 모든 트윗에 url을 넣거나, "earn money," "weight loss," and "work from home"과 같은 문구를 반복하는 패턴을 찾았다.

그리고, 5개 알고리즘으로 "following" 관계를 분석해 본 결과
Google researcher인 Daniel Tunkelang 가 만든 "TunkRank”가 가장 효과적이라는 결과를 얻었다.

즉 TunkRank는 most authority 한 twitter들을 찾는 것 뿐만 아니라 spam filter 에도 크게 효과적이라는 결과.

이들은 이밖에도 follower 수에서 그들이 following 하는 수를 discounting 하는 방법을 시도해봤다.
이는 대량의 following을 통해 follow back을 받는 twitter들을 가려내는 좋은 방법이긴 했지만,

결과적으로 스패머들을 가려내는 만큼, 일반 유저들도 피해를 받게 되었다고 한다.

이 글에 대한 내 생각은 여기에.

Posted by JulieNJulia
:

BLOG main image
결국은 사람 by JulieNJulia

카테고리

분류 전체보기 (702)
인공지능 AI (3)
read things (47)
work life (20)
검색 IT (86)
인지과학 HCI (46)
research (3)
일상다반사 (61)
마음이 울리다 (76)
그림 Drawing (1)
말, 말, 말 (32)
좋을텐데 (0)
My Digg (0)
Today's attention (9)
life log (3)
private (0)
social network (0)
영화 (3)
여행 (2)
문화생활 (0)

달력

«   2024/05   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31

글 보관함

최근에 올라온 글

최근에 달린 댓글

최근에 받은 트랙백