'블로그랭킹'에 해당되는 글 1건

  1. 2008.01.08 스팸 블로그 골라내기와 블로그 검색 1

고감자님 블로그에서 알게된
Detecting Spam Blogs: A Machine Learning Approach 논문

기계학습적 방법은 오래전부터 아직 멀었다고, 실용적인 것에 적용하긴 무리라고 생각하지만, 이 논문의 좋은 점은 개인적으로 블로그 검색이라는 것에 블로그의 특성, 블로그 검색의 특성을 아주 잘 파악하고 있다는 생각이 든다.
역시... 범용적인 스팸모듈도 중요하지만 글의 특성을 간과할 수 없는 것.

그리고 자신감을 좀 더 얻은 건 작년에 작업해서 5월에 적용된 블로그 검색 랭킹이 블로그 글의 특성에 적합했다는 것;)   (키워드는 어제 오늘 구독중인 블로그들 특히 외국 IT나 검색 관련된 내용의 태반을 차지하고 있는 "wikia")

마음에 남는 부분은 논문 중 특히 이부분.
Blog search engines rank results primarily by recency, rather than using popular social ranking techniques (Page et al. 1998). This is less of a technology related choice, and driven more by an audience that demands tracking “buzz” rather than authority.


Posted by JulieNJulia
:

BLOG main image
결국은 사람 by JulieNJulia

카테고리

분류 전체보기 (702)
인공지능 AI (3)
read things (47)
work life (20)
검색 IT (86)
인지과학 HCI (46)
research (3)
일상다반사 (61)
마음이 울리다 (76)
그림 Drawing (1)
말, 말, 말 (32)
좋을텐데 (0)
My Digg (0)
Today's attention (9)
life log (3)
private (0)
social network (0)
영화 (3)
여행 (2)
문화생활 (0)

달력

«   2024/05   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31

글 보관함

최근에 올라온 글

최근에 달린 댓글

최근에 받은 트랙백