회사에서 로컬 장소 검색 품질 평가 항목 만들다가 찾은 

구글 검색 품질 평가 자료 찾은 내용 간단하게 공유합니다. 


구글은 전세계 곳곳의 Human evaluator들을 선발해서 검색 품질 평가를 하고 있고 (http://allthingsd.com/20090603/google-and-the-evolution-of-search-scott-huffman/)

역시 구글답게 장장 125 페이지에 이르는 품질 평가 가이드 라인에 맞춰 평가하도록 교육하고 있습니다.


간단하게 보면, 


쿼리를 일반적으로 알려진 아래의 3가지 분류해서 

* Navigation Queries – “Go” : 홈페이지나 사이트 찾아가는 니즈 쿼리. 우리로 치면 바로가기, 사이트성 

* Action Queries – “Do”, : 다운로드 받거나 물건을 사는 등등의 액션을 취하기 위해 검색하는 니즈. 

* Information Queries – “Know”, : 일반적인 정보 찾는 니즈.


대략 다음과 같은 scale 로 평가합니다.

* useful     : 매우 유용

* relevant  : 유용

* slightly relevant  : 약간 유용

* off-topic / useless : 관련없거나 전혀 유용하지 않음.


이외에 공식 홈페이지에 대해서 "vital" 스케일로 별도 평가하고,

스팸(Not Spam, Maybe Spam, Spam)이나 음란/악성 여부(Porn, Malicious)를 별도 플래그로 표시합니다

 


일반적인 웹검색 평가 기준이라 한국의 통합검색이나 로컬 등 버티컬 검색 평가 기준에 아주 들어맞지는 않지만, 체계성과 정교한 가이드는 역시 구글이네요.  

참고)
구글 검색 품질 평가 관련 예전 글
Google and the Evolution of Search

구글 검색 품질 평가 방법 (How Google Measures Search Quality)


Posted by JulieNJulia
:

I. Human Evaluators — Google Engineering director Scott Huffman

    1. 구글 "검색 품질 평가 팀"에 관한 얘기
      • 초반에 세르게이의 favorite 10쿼리 에서 출발하여 현재 검색 품질 관리에 이름
      • 여기에서 평가된 검색 품질은 알고리즘 개선에 활용되긴 하지만 직접적으로 영향 미치지 않음.
      • 검색품질이 좋다는 것은 결국 "사람"이 아는 것이므로.
      • 아마도 머신러닝 데이터로 활용할 듯.
        알고리즘 팀이 하는 건.. 중요한 팩터는 뽑아야 할거고, 머신러닝을 통해 개선하지 않을까.

II. Cheating the System — Google software engineer Matt Cutts

    1. 어뷰징, 스팸 등 문서/사이트 퀄러티에 관한 얘기
    2. 역시나 사람 손을 태우느냐에 대한 부분 질문 
      we are sometimes willing to take manual action on those sorts of policy violations. But Google’s philosophy is that wherever you can use machines and algorithms

    3. 인상적인 건, 언젠가 사람이 개입하지 않을 날이 올까? 에 대한 Matt cutt의 답변
      our intent is always to try to make sure that we handle things efficiently with machines and algorithms. But I don’t know that we will ever get there completely.
    4. 나도 매우 동감 최대한 효율적이어야 하지만 사람을 완전히 뺄 수 있을까. 

III. What’s Next in Search? Much, Much Better Search — Google Fellow Amit Singhal

    • recall & precision
      • recall => precision =>combination of recall and precision
    • search evaluation
      • human evaluator
    • how fresh is the document? How relevant? How useful?
    • Whatever type of content is relevant to you should just show up in your search results
      • 이거야말로 통합검색 아닌가.
Posted by JulieNJulia
:
이동할 때 가장 하고 싶은게 웹서핑 또는 rss 구독한 블로그 포스트들을 둘러보는 것이다. 따로 시간을 내서 전부 보긴 그렇지만 왔다갔다 할때는 굳이 시간에 쫓기지 않고도 훑어볼 다양한 거리들이 있기에.

문제는 인터넷이 안되면 말짱 꽝이라는 것. 티로그인이나 kt와이브로를 가입할 정도의 필요성은 아니고.

오늘 문득 온오프라인 연동 rss 리더기가 있지 않을까 해서 검색해 봤더니.
구글 기어스(gears.google.com)이 바로 구글 리더기(google reader)에서 온 오프 연동을 하게 해주는 애플리케이션이었던 것.

그러나 설치하면 뜬다는 "offlne"연동 버튼이 내 놋북에선 아무리 뒤지고 데탑의 구글 기어스 셋팅을 카피해도 안되서 내내 온갖 삽질을 거듭하다가 혹시 하는 맘에

www.google.co.kr대신 www.google.com으로 접속했더니 "offline"연동 버튼이 뜨더라.
젠장 한글 버전에서는 안되는 것이었던 것이었다. 오늘의 삽질--;
다른 사람들은 나처럼 삽질하지 않기를.

발견해서 offline연동하여 포스트들 다운받아놓으니 든든하다..
퇴근길 밀린 블로그 포스트들 둘러봐야지~
Posted by JulieNJulia
:
  • 구글랩 infoview 추가

    http://www.google.com/views?q=second+life+view%3Ainfo&vwms=&vwme=&btnGi=Search

    구글랩에서 기존 timeline, map view외에 이번에 추가로 info view를 추가
    오른쪽에 보면 옵션별로  date, measurement, location, image 들을 클릭하면 검색 결과 페이지에서 해당 정보들 위주로 써머리&하이라이팅 해서 보여주는.

    검색결과 디스플레이에도 다양한 시도와 사용자 편의성을 고려/고민하는 구글
    (아 어느 세월에...)
Posted by JulieNJulia
:

Cutts on NYT Human Search Story 
지지하고 싶은 포스트. 사람을 빼고 기술을 논할 수 있단 말인가.
단지 사람들의 경험과 지혜를 얼마나 체계적으로 버리지 않고 반영할 수 있는가.. 그게 관건일뿐

NYT의 원본 기사
The Human Touch That May Loosen Google’s Grip 

Cutt인터뷰
A Brief Interview with Google's Matt Cutts
Do you think there is a growing role for human presence in Google's online technologies?

Cutt이 운영하는 블로그의 글
http://www.mattcutts.com/blog/the-role-of-humans-in-google-search/





 


 


Posted by JulieNJulia
:
Google Keeps Tweaking Its Search Engine
  구글 랭킹 및 검색 품질 향상 팀 인터뷰

Google Shows More Fresh Results
  최신 검색 결과를 더 보여주는 구글. 일명 QDF(query deserves freshness)

네이버 '끝음절 검색어' 랭킹 서비스 제공


Posted by JulieNJulia
:

구글 SMS

2007. 3. 28. 09:19
구글에서 이런것도 되고 있었구나..

간단하다.
검색 쿼리를 구글에게 SMS로 보내면 해당 검색 결과를 역시 SMS로 보내준다.
현재까지는 미국과 캐나다내에서만 지원된다는 듯.
여기에서 데모해 볼 수 있다.
사용자 삽입 이미지

단순 검색이외에도 날씨(weather NYC)나 단어 번역 (translate hello in french), 또는 물건가격(price ipod player 40gb)과 같은 숏컷 명령어성 쿼리도 지원된다.

모바일 웹에 대한 논의가 많이 있어 왔다.
작은 화면과  불편한 인터페이스를 어떻게 극복할 것이냐.

SMS.. 단순한 생각이지만 간단한 검색이라면 그저 친구에게 SMS 보내듯 쿼리 몇단어 던지면 원하는 검색결과 주겠다니.

핸드폰으로는 네이트 온과 같이 별도 접속하고 원하는 메뉴 찾는 동안 몇번의 데이터 전송 기다려야 하고 했던 기억만 있는 나로서는.

우리나라에서 된다면.. 나라면 쓰겠다. 간단하자나.
Posted by JulieNJulia
:

구글 블로그 랭킹

2007. 3. 21. 01:35
오늘 아니 어제 아침에 발견한 구글 블로그 검색 랭킹
얘네들은 자꾸자꾸 특허를 걸어댄다.

이번의 블로그 검색 랭킹 특허는, 대충 훑어본 바로는 쿼리에 대한 문서의 관련도(relevance)와 문서 자체의 퀄러티(quality)  점수를 같이 고려해서 랭킹을 매기는 데, 문서 자체의 퀄러티 점수에 positive 요소와 negative 요소를 같이 고려하며 그 요소는 이런 것들이다. 라는 것이 골자인 듯.

이 외에도 중복 문서 제거등 요새 구글의 특허를 자주 볼 기회가 있어서
소프트웨어에서의 특허에 대해 얘기하자면.

솔직히 무식한 얘긴진 모르겠지만
땅따먹기처럼 이런방식은 우리가 선점했으니 너넨 쓰지마 라면,
그럼 같은 걸 고민하고 있는 다른 사람들(나도 한사람)은 어쩌라고 싶은 맘.

최근 네이버, 다음 소스 코드 복제건도 있었지만 여튼 출처만 명기하고 잘 가져다 쓰라는 오픈 소스라는 것도 있는데.

심지어 컨셉마저도 돈 내고 쓰라는 얘기인 건가. (이런 특허는 어떻게 적용되는 건지 사실 잘 모름)
역시 어떤 특허의 컨셉이 이용되어 구현되었다고 명시하고 다같이 사이좋게 쓰는게 어때? 하면 말 안되는 소린가 --a

지적 재산권 문제가 민감하긴 한데, 발명 특허가 소프트웨어에는 기준이 좀 애매하다는 생각.
페이지 랭크와 같이 아무도 생각하지 못한것, 아니지 단정지을순 없지만 정말 혁신적인 건 깔끔히 인정.

솔직히 깔끔은 아니고 이쪽 업계에 있는 사람으로써 이거 독과점 아니야 싶긴 하다. 특허라는게 아이디어이고 물론 어느정도 수준의 구현안이 포함되어 있긴 하지만 최소한 퍼즐 한조각 이상은 숨겨져 있고, 그걸 끼워 맞추지 못하면 알아도 재현해 낼 수 없다고 본다. 그리고 그 감춰진 퍼즐 한 조각이상을 맞춰 내는 건 기술력이라고 봐야지 않나 싶은데.. 내 논에 물대기인가..

특허와 지적 재산권에 대해서는 특히 소프트웨어에 대해서는 다시 한번 생각해 보기. 사실 그동안 중요하지 정도만 생각해 왔을 뿐 이렇게 구체적?으로 느껴본적은 없기에.



Posted by JulieNJulia
:
아무래도 검색쪽 일을 하다보니
오늘 발표 있을거라던 구글의 한국 R&D센터 설립 계획이 궁금했었다.
정신없이 있다가 좀전에 생각나 검색해 보니
단지 설립 협약을 맺는 것이지, 구체적인 인력 규모나 투자 분야 계획은 밝혀진게 없나보다
찾아본 기사는
구글,R&D센터 설립 본격 한국 공략
구글, '한국 R&D센터' 설립 배경과 영향은
구글 R&D센터 한국내 설립 '뭔가 이상해?'

이것도 있네.
구글 한국 R&D 센터 진출?
(난 뉴스도 뉴스지만 그 뉴스에 대한 사람들 반응, 보는 시각의 차이들이 사실 훨씬 더 재미있다. 그래서 뉴스보다는 블로그에서 다뤄진 이슈들을 보는게 즐겁다)

구체적인 정보가 없다 보니 기사들 대부분이 추측성 걱정 분위기 인듯.
주변 사람들도 오늘 나름 기대감을 가진 사람들이 있었는데 어떻게들 받아들였을라나.
Posted by JulieNJulia
:

구글의 searchmash

2006. 10. 7. 02:30
http://searchmash.com/
아무래도 인터페이스가 눈에 띈다.

구글 화면에서는 웹문서, 이미지, 뉴스 등으로 나누어 있어서 대부분 웹문서 검색결과 만을 보고 이미지등이 있는지 모르는 사람도 많을텐데,
아무래도 이미지가 시각을 자극하는지라 우리나라 포털들은 이미지 검색에 신경쓰지만 너무 복잡하고.

search mash처럼 검색 결과와 적당한 개수의 이미지 노출은 역시 깔끔함을 유지해 가고.
재밌는건 검색 결과를 드래그 앤 드롭해서 순서 조정을 할 수 있다는 것. 해보지 않으면 전혀 알 수 없지만. 조정한 결과를 어디다 어떻게 써먹는 건지는 잘 모르겠네.

그리고 검색 결과의 url부분을 클릭하면
현재창에서 보여줄지, 새창에서 보여줄지, 해당 사이트로 좁혀서 검색을 해볼지, 비슷한 페이지를 찾아볼건지, 캐쉬된 내용을 보여줄건지등등을 선택할 수 있게 되어 있다.

옵션이 다양한 건 좋은데 두번의 input을 요구하는건 글쎄.

여튼 흥미로운 사이트.
Posted by JulieNJulia
:

BLOG main image
결국은 사람 by JulieNJulia

카테고리

분류 전체보기 (702)
인공지능 AI (3)
read things (47)
work life (20)
검색 IT (86)
인지과학 HCI (46)
research (3)
일상다반사 (61)
마음이 울리다 (76)
그림 Drawing (1)
말, 말, 말 (32)
좋을텐데 (0)
My Digg (0)
Today's attention (9)
life log (3)
private (0)
social network (0)
영화 (3)
여행 (2)
문화생활 (0)

달력

«   2024/04   »
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30

글 보관함

최근에 올라온 글

최근에 달린 댓글

최근에 받은 트랙백