원문은 여기

A Better Way To Filter Twitter's Spambots? Ask Google

아래는 대략의 기사 번역 내용.

소수의 가치있는 news와 wisdom, 그리고  
대량의 nonsense와 marketing junk 가 공존하는 트위터에서 어떻게 follow할 가치있는 twitter들을 찾아낼 것인가.

스페인  Oviedo 대학의 두 교수,
Daniel Gayo-Avello 와 David Brenes가
이달 초 마드리드에서 열린 information retrieval conference 에서

계속적으로 증가하는 spammers 들과 advertisers 로부터
가치있는 microbloggers 를 골라내는(sorting) 논문을 발표했다.

단순히 follower 수만으로는 알기 어렵다.  
대량의 following 을 통한 "autofollowing"과 자신을 follow하지 않는 사람을 unfollow 함으로써, 빠르고 쉽게 Twitter authority를 조작하는 것이 가능하기 때문.

It works for some (e.g. CNN or Obama) but not for everyone (e.g. spammers).

이 두 교수는 Twitter spammers과  aggressive marketers을 분석하기 위해 8달 넘게 5백만 가량의 영어권 twitter를 분석했다.

그 결과, 모든 트윗에 url을 넣거나, "earn money," "weight loss," and "work from home"과 같은 문구를 반복하는 패턴을 찾았다.

그리고, 5개 알고리즘으로 "following" 관계를 분석해 본 결과
Google researcher인 Daniel Tunkelang 가 만든 "TunkRank”가 가장 효과적이라는 결과를 얻었다.

즉 TunkRank는 most authority 한 twitter들을 찾는 것 뿐만 아니라 spam filter 에도 크게 효과적이라는 결과.

이들은 이밖에도 follower 수에서 그들이 following 하는 수를 discounting 하는 방법을 시도해봤다.
이는 대량의 following을 통해 follow back을 받는 twitter들을 가려내는 좋은 방법이긴 했지만,

결과적으로 스패머들을 가려내는 만큼, 일반 유저들도 피해를 받게 되었다고 한다.

이 글에 대한 내 생각은 여기에.

Posted by JulieNJulia
:
BLOG main image
결국은 사람 by JulieNJulia

카테고리

분류 전체보기 (702)
인공지능 AI (3)
read things (47)
work life (20)
검색 IT (86)
인지과학 HCI (46)
research (3)
일상다반사 (61)
마음이 울리다 (76)
그림 Drawing (1)
말, 말, 말 (32)
좋을텐데 (0)
My Digg (0)
Today's attention (9)
life log (3)
private (0)
social network (0)
영화 (3)
여행 (2)
문화생활 (0)

달력

«   2024/04   »
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30

글 보관함

최근에 올라온 글

최근에 달린 댓글

최근에 받은 트랙백