회사에서 로컬 장소 검색 품질 평가 항목 만들다가 찾은 

구글 검색 품질 평가 자료 찾은 내용 간단하게 공유합니다. 


구글은 전세계 곳곳의 Human evaluator들을 선발해서 검색 품질 평가를 하고 있고 (http://allthingsd.com/20090603/google-and-the-evolution-of-search-scott-huffman/)

역시 구글답게 장장 125 페이지에 이르는 품질 평가 가이드 라인에 맞춰 평가하도록 교육하고 있습니다.


간단하게 보면, 


쿼리를 일반적으로 알려진 아래의 3가지 분류해서 

* Navigation Queries – “Go” : 홈페이지나 사이트 찾아가는 니즈 쿼리. 우리로 치면 바로가기, 사이트성 

* Action Queries – “Do”, : 다운로드 받거나 물건을 사는 등등의 액션을 취하기 위해 검색하는 니즈. 

* Information Queries – “Know”, : 일반적인 정보 찾는 니즈.


대략 다음과 같은 scale 로 평가합니다.

* useful     : 매우 유용

* relevant  : 유용

* slightly relevant  : 약간 유용

* off-topic / useless : 관련없거나 전혀 유용하지 않음.


이외에 공식 홈페이지에 대해서 "vital" 스케일로 별도 평가하고,

스팸(Not Spam, Maybe Spam, Spam)이나 음란/악성 여부(Porn, Malicious)를 별도 플래그로 표시합니다

 


일반적인 웹검색 평가 기준이라 한국의 통합검색이나 로컬 등 버티컬 검색 평가 기준에 아주 들어맞지는 않지만, 체계성과 정교한 가이드는 역시 구글이네요.  

참고)
구글 검색 품질 평가 관련 예전 글
Google and the Evolution of Search

구글 검색 품질 평가 방법 (How Google Measures Search Quality)


Posted by sunseed

올해 2월 검색 컨퍼런스, 그리고 지난주 '검색의 미래' 세미나에서 발표한 내용 중 

"소셜 검색" 정리


twitter, facebook과 같은 SNS(Social Network Service)로 인해 “소셜"이란 용어가 주요 키워드로 급부상하였는데,  

그렇다면 소셜 검색이란 무엇일까.
 

"소셜"이란 용어자체가 광범위하다 보니 소셜 검색이라는 용어도 다양한 의미로 사용되고 있다.


1. SNS Search - Social Network Service 데이터를 검색해 주는 것
 

단순하게는  Social network service 상의 데이터, 트위터, 페이스북, 미투데이등과 같은 데이터를 검색해주는 것도 일종의 소셜 검색이라 부를 수 있다.  
 

ex) 다음 소셜웹 검색 (http://goo.gl/JrBqG)


참고) SNS 로 인한 실시간 검색 (Real Time Search) 트랜드 

SNS  서비스 특징은 문서라기 보다는 짧은 글들이고, 이슈 확산이나 공유가 쉽고 빠르기 때문에 이로 인한 실시간 검색(real time search) 니즈도 급격히 커진 것도 사실이다.


다음이나 네이버에서도 분, 초 단위로 검색결과를 실시간 업데이트해주는 기능을 제공하고 있다. 

ex) 다음 실시간 검색 (http://goo.gl/GWzjK)


구글도 사람들이 최신 내용을 검색보다는 트위터나 페이스북에서 확인한다는 고민에서 출발해서, 올 11월 검색 랭킹 알고리즘에서 최신성을 강화하기도 하였다.
("Google Freshness Algorithm Update"
 - http://goo.gl/AQ8Ls) 


 2. Collective Social Search - Social Network Service 에서 화제가 되는 내용을 찾아주는 것.


SNS 서비스 특징은 retweet, like 등 이슈 확산이나 공유가 쉽고 빠르다는 것이고,

이렇게 SNS상에서 이슈나 화제가 되는 내용을 찾아서 보여주는 것도 하나의 소셜 검색으로 볼 수 있다.

일테면 집단지성과 같이 다수가 만들어 내는 흐름. 
 

 ex) 다음 화제의 글 검색 (http://goo.gl/VcvRT)


3. Friend-Filtered Social Search - 친구가 추천해 주는 검색 결과


내 친구, social network 상의 관계 정보를 검색에 이용하여 필터링하거나 검색결과에 신뢰도 정보로 제공해 주는 것.


ex) facebook의 like 를 검색해 주거나 이를 검색결과에 표시해 주는 Bing 검색이나 Blekko 등의 서비스.

gg+ 에서 공유한 내용을 검색결과에 표시해 주는  google 검색.


다음도 로그인 해서 검색했을 경우,  내가 가입한 카페나 블로그 검색결과를 별도로 보여주는 "마이 소셜 검색" 결과를 제공한다.


4. Q&A Search - 질문에 대해 사람이 직접 답해 주는 것
 

사람이 직접 알려준다는 측면에서 Humanized Search 라고도 불리고, 일종의 Collaborative search 라고 볼 수도 있다. 
 

우리나라에는 일찌감치 지식검색으로 유명해졌지만, 해외에서는 여전히 인기있고, 많은 서비스가 생기고 있다.  Q&A 검색에서는 사람의 신뢰도가 중요한 정보.

인기를 얻고 있는 Quora의 경우  "We're developing an algorithm to determine user quality" 힘쓰고 있다고도 하였다. 


ex) 네이버나 다음의 지식검색 , Yahoo answers, Aardvark, Quora 등 



다양한 의미로 사용될 수 있는 "소셜 검색"에 대해, 크게 이 정도로 나누어 볼 수 있을 것 같다. 

소셜 검색에 대해서는 다음 링크들 참고.

3 Flavors of Social Search

'Natural' Search User Interfaces


Posted by sunseed

Google places 어플 아이폰 지원, 나와 친구들의 취향에 맞는 장소를 추천해 주는 Google Hotpot에 이어 이제는 foursquare와 같은 Checkin 기능도 선보이는 구글.

관련 링크 : Google’s Mobile Moves Tighten Its Grip On Local

1. Google Places 어플

현재 위치 중심으로 주변 장소들을 보여주고, 평가할 수 있음

무엇보다 바로 주변 음식점, 카페, 술집 등을 선택해서 볼 수 있는 점이 좋음.

그리고 “Directions to here”로 바로 찾아 볼 수 있게 되어 있는 점과.

 


 
이것 때문에 음식점 찾아갈 때 바로 사용해 보게 되더라는. (다른 어플 맛집에서 음식점, 술집 골라내기 불편해서)

 이처럼, 모바일에서는 기능은 다 있어도, 어떻게 접근 경로를 잘 만들어 줄거냐(사용성)가 특히 더 중요.


 관련링크 : Now available: Google Places with Hotpot for iPhone

2. Lattitude에 체크인 checkin 기능 탑재


다른 서비스들 보다 좀 더 강화된 Check in/out 기능들 - 도착할 장소에 reminder를 보내거나, 자동check in/out 등 - 반면,  아직 새로운 장소를 추가할 수 없고(Google Places 에 등록된 장소들만 가능), twtiter나 facebook으로 공유할 수 없으며, 무엇보다 현재 Android만 가능하고 아직 iphone을 지원하지는 않음.

관련 링크 : Google Finally Adds Check-Ins To Latitude, With A Couple Twists

3. Google Hotpot

나와 친구들이 평가한 장소들을 기반으로 장소 추천해 주는 Google Hotpot.
내가 많이 평가할 수록, 내 취향에 맞는 장소를 더 많이 추천.

Hotpot정보들은 Google Places 검색 결과에 활용됨. 즉 친구들이 추천하는 장소, 나에 맞춤 장소 검색 결과를 구분해서 볼 수 있음.

  • All results
  • Friends only
  • Just for you

  • Google Hotpot 소개 동영상




  • 관련 링크:
    - Google Hotpot now on Google.com and around the world
    - Discover Yours: Local recommendations powered by you and your friends

  • 그야말로 Mobile + Local +Social 이 함께 맞물려 돌아가는 움직임
Posted by sunseed

Google vs Bing

2011/02/04 10:14

Bing이 google 검색 결과를 도용했다는 구글Danny Sullivan의 주장, 그리고 이에 대한 빙의 공식적인 부인. 검색 알고리즘에 여러 정보를 활용하고 그 중 하나인 click 정보일 뿐이라는 주장.  
그리고 구글이 왜 지금 이 시점에서?와 같은 주변의 관전평들.
( + 추가로 빙 입장도 생각해서 살짝 정정한 Danny Sullivan 이야기와 전반 공방 내용 잘 요약한 Daniel Tunkelang 기사 )

구글과 Danny Sullivan에 따르면,
tarsorrhaphy 의 오자인 "torsoraphy"의 검색 결과가 빙에서 오자란 표시도 없이  tarsorrhaphy의 구글 첫번째 검색 결과가 뜨는 것을 보고 빙을 의심하기 시작





그래서 bing을 의심스럽게 생각한 구글 측 사람들이 bing 툴바를 설치하고 실험을 시작.
hiybbprqag, mbzrxpgjys, indoswiftjobinproduction 등과 같은 검색어들을 입력하고 구글 검색결과를 만들었더니 어느 순간 빙에도 같은 검색 결과가 뜨더라는 이야기.





빙은 이에 대해 검색 랭킹 알고리즘에 수많은 정보를 사용하고 있으며, 그 중 하나인 사용자 클릭 정보로 인한 결과일 뿐이며, 구글의 실험은 검색결과 어뷰징하는 사람들이 많이 쓰는 방식과 같은 덫이라고 주장.

개인적으로 long tail query에 대해서라면,
검색결과 없는 검색어에 대해 다른 검색엔진 결과 긁어와서 보여주는 것은,
랭킹이 아닌 data coverage나 recall 확보 측면에서 괜찮은 아이디어라는 생각.

Google과 Danny가 증거로 내세운 건 오자 입력한 long tail 쿼리라서.

아래는 관련 기사 모음들

[구글 측]
- Google: Bing Is Cheating, Copying Our Search Results   (from Danny Sullivan)
- Microsoft’s Bing uses Google search results—and denies it (from Google's Amit Singhal )
- Google Results, One of Bing's Ranking Signals (Google officical Bolg)


[빙 측]
Setting the record straight
Microsoft: 'We do not copy Google's results'
Thoughts on search quality

[기타 관련 기사]
- So, Bing's Copying Off Google: What Now, Google? 
Bing Copying Google: And I Care Why?
Bing’s Search Results Are A ‘Cheap Imitation’, Google Says

- Wow, Microsoft And Google Are Punching Each Other In The Face Right In Front Of Us!
-
Google Says Bing Cheated

[Update  추가 : 2010.2.6] 
* Bing: Why Google’s Wrong In Its Accusations
 다시 Bing 측 입장에서 올린 Danny Sullivan의 기사
“Google: Bing Is Cheating, Copying SOME Of Our Search Results"
이 주요 골자. 

그리고 잘 요약해 놓은 Daniel Tunkelang의 
*  Google vs. Bing : A Tweetie Beetle Battle Muddle

참고로 빙의 부인에 좋은 이야기가 많아서 인용

 
We use over 1,000 different signals and features in our ranking algorithm. A small piece of that is clickstream data we get from some of our customers, who opt-in to sharing anonymous data as they navigate the web in order to help us improve the experience for all users.

To be clear, we learn from all of our customers. What we saw in today’s story was a spy-novelesque stunt to generate extreme outliers in tail query ranking. It was a creative tactic by a competitor, and we’ll take it as a back-handed compliment. But it doesn’t accurately portray how we use opt-in customer data as one of many inputs to help improve our user experience.
...
We believe search needs to do more for customers



Posted by sunseed

Modern Information Retrieval 2nd Edtion 발매 소식

아마존에서 예약 주문 받고 있다. 1/17일 발매 예정이었는데 아직인 걸 보니 좀 더 걸릴 듯. 

우리나라에는 최신 정보 검색론”으로 번역되어 알려진 Modern Information Retrieval 1판에 비해 전반적으로 내용이 많이 보강되었다.

아무래도 1판 발매 후 10여 년의 세월이 지나기도 했고.

특히 Retrieval Evaluation 부분 - DCG(Discounted Cumulated Gain) 와 A/B testing.

그리고 Text Classification, Structured text retrieval, Enterprise Search 등. 

1판의 "Searching the web"을 Web Retrieval과 Web Crwaling 으로 나누어 좀 더 자세하게 다루고 있고.

저자인 Ricardo Baeza-Yates가 야후에 몸담고 있어선지 실무에 유용한 다양한 내용들이 포함되어 있다.  

정보 검색 교재로 보면,

스탠포드 IR로 알려져 있는 Introduction to Information Retrieval 이 검색 개념을 하나씩 차근차근 알려준다면,

Modern Information Retrieval 2nd Edtion 은  좀 더 종합적인 관점에서 실무에서 일하다 보면 생각해 보게 되는 내용들을 다루고 있다는 생각.

책 공식 사이트에 몇 챕터는 공개되어 있기도 하다.
 
목차만 봐도 다양한 내용들이 다루어 지고 있는 걸 알 수 있다.

더보기


개인적으로 검색 실무하는 사람들에게 추천.

Posted by sunseed
  Saracevic (1975, 1996, 2007)은 적합성을 5가지 유형으로 정의하였다. 
  (1) 시스템 적합성은 검색어와 문서와의 유사도 
  (2) 주제 적합성은 검색어와 문서와의 주관적 유사도
  (3) 인지 적합성은 문서와 사용자의 지식상태와의 부합 정도
  (4) 상황 적합성은 정보와 사용자의 상황, 문제 공간, 과제 등과의 부합 정도
  (5) 정서 적합성은 정보와 사용자의 의도, 목적, 동기와의 부합 정도를 말한다(Saracevic 1996; Freund 2008). 각 적합성 유형을 자세하게 살펴보면 다음과 같다.

시스템 적합성 (System Relevance) 
    시스템 적합성은 객관적 적합성 유형에 속하는 것으로 시스템상의 검색어와 정보의 관계에 대한 것이다. 즉 시스템 상의 검색 성공 또는 실패를 말한다. 시스템 적합성은 일반적으로 “논리적” 적합성(Cooper 1971) 또는 객관적 관점의 “주제적” 적합성으로 알려져 있으며, “문서의 주제가 요구사항의 주제와 얼마나 잘 매치되었는가. 만약 문서가 요구 사항의 주제를 다루고 있다면 해당 문서는 객관적으로 적합하다”(Harter 1992, p.602)고 정의되었다. 시스템 적합성은 전통적인 검색 시스템 평가에서 일반적으로 많이 사용되었다. 시스템 적합성에 의하면 검색된 집합은 검색어와 적합한 것으로 간주될 수 있다.

주제 적합성 (Topical Relevance)
    검색어의 주제와 정보 객체에서 다루는 주제와의 관계를 말한다. 다시 말하면, 사용자가 문서의 주요 내용이 관심 주제와 관련 있다고 인식하는 것이다(Saracevic 1996). 만약 사용자가 문서가 관심 주제에 대한 것으로 믿는다면 이는 주제상 적합하다. 이는 검색어와 객체가 둘 다 주제에 대해 정의될 수 있다는 것을 전제로 한다. 주제성(aboutness)이 주제 적합성의 척도가 된다. 주제 적합성은 벡터 스페이스 모델에서의 코사인(cosine) 유사도와 같이 기계적으로 계산되는 시스템 적합성과는 달리, 사용자의 주관적 판단을 말한다(Xu & Chen 2006; Borlund 2003). 즉 정보 요구와 문서의 주요 내용이 얼마나 잘 맞는지를 사람이 판단하는 것으로 지적 주제성(intellectual topicality)으로 명명되기도 하였다(Borlund 2003).

인지 적합성 (Cognitive Relevance)
    인지 적합성은 문서가 사용자의 지식 상태에 어떻게 영향을 미치는지를 말한다(Borlund 2003; Howard 1994; Saracevic 1996). Saracevic (1996)은 인지 적합성을 문서가 사용자의 지식에 인지적으로 부합하는지와 문서의 정보성으로 규정지었다. 인지적 일치(Cognitive correspondence), 정보성, 신선성, 정보 품질 등이 인지 적합성을 유추할 수 있는 척도가 된다. 인지 적합성은 사람에 따라 그 지식 정도나 이해 수준에 따라 달라 질 수 있는 반면, 주제 적합성은 문서의 주제가 여러 사람들에게 좀 더 일반적으로 보편적으로 판단될 수 있다는 점에서 차이가 있다.

상황 적합성 (Situational Relevance)
    상황 적합성은 문제 해결에 있어 문서의 실용적 유용성을 일컫는다(Cosijn & Ingwersen 2000; Saracevic 1975; Saracevic 1996; Schamber 1994; Borlund 2003). 즉 상황, 과제, 문제 등과 정보 객체와의 관계를 말한다. 의사 결정에 있어서의 유용성, 문제 해결에 있어서 정보의 적절성, 불확실성의 감소 등이 상황 적합성을 유추할 수 있는 척도가 된다. 이러한 관점에서 문서가 문제 해결에 기여한다면 적합한 반면, 그렇지 않으면 부적합하다고 볼 수 있다.
    처음 상황 적합성의 개념을 소개한 Wilson(1973, p.458)은 상황 적합성을 “어떻게 사람들이 정보를 사용하고 어떻게 그들의 관점이 변하는지 등과 같은 정보의 실질적 사용과 효과”라고 정의하였다. Saracevic(1975, p.334)은 “정보 검색 시스템에서 적합한 정보를 제공하는 것이란 유용한, 즉 주어진 문제를 해결하는데 직접적인 도움이 되는 정보를 제공하는 것이다”라고 하였다. Borlund (2003, p.922)는 상황 적합성을 사용자 중심의 경험적, 현실적 그리고 역동적인 적합성 유형이라 하였다.
    상황 적합성은 유용성(usefulness), 가치(value), 효용성(utility), 실용적 기능(pragmatic application) 또는 과제나 문제에 대한 문서의 정보성 등으로 정의되기도 하였다(Cosijn & Ingwersen 2000; Hjørland & Christensen 2002; Mizzaro 1997; Park 1997; Saracevic 1975). Borlund(2003)는 실질적인 문제와 얼마나 밀착되어 있는지가 인지 적합성과 상황 적합성 간의 핵심적인 차이라고 지적하였다. 즉 상황 적합성은 즉각적으로 실제 문제 해결에 대한 필요에 기반을 둔데 반해, 인지 적합성은 그렇지 않다(Xu & Chen 2006). 주제 적합성이나 상황 적합성의 차이 또한 문서의 실용성 기능에서 찾아 볼 수 있다(Xu & Chen 2006). 예를 들어 어떤 사람은 단지 호기심을 만족시키기 위해 정보를 검색할 수도 있다(Xu & Chen 2006). 상황 적합성은 또한 사회적 그리고 문화적 요인을 포함하는 것으로 확장될 수 있다(Cosijn & Ingwersen 2000).
많은 연구에서 현실적인 적합성 유형으로 여겨진 상황 적합성을 다루었다(Schamber et al. 1990; Barry 1994; Harter 1992; Park 1997; Choi & Rasmussen 2002).

정서 적합성 (Affective Relevance)
    정서 적합성은 사용자의 의도나 목적, 목표, 정서, 동기 등과 문서의 관계를 일컫는다. 즉 문서가 사용자의 의도, 목적, 동기 등을 만족시키는지에 따른 정서적 반응을 말한다(Saracevic 1996). 만족, 성공, 목적 달성 등이 정서 적합성을 유추하는 척도가 된다. 정서 적합성은 다른 적합성 유형, 특히 상황 적합성의 근간이 될 수 있다. 의도, 목적, 동기 등은 사용자로 하여금 정보를 찾고자 하고, 정보 검색을 수행하고, 검색된 결과의 적합성을 평가하게 되는 동력이 된다.

  - 출처: 박정아 (2010), "정보검색에서의 사용자 중심 적합성 판단 모형 개발 및 평가"  

주요 참고문헌
  • Saracevic, T. (1975). Relevance: A review of and a framework for the thinking on the notion in information science. Journal of the American Society for Information Science, 26, 321-343.
  • Saracevic, T. (1996). Relevance reconsidered '96. In P. Ingwersen & N.O. Pots (Eds.), Second International Conference on Conceptions of Library and Information Science (CoLIS2) (pp. 201-218). Copenhagen: Royal School of Librarianship.
  • Saracevic, T. (2007). Relevance: A review of the literature and a framework for thinking on the notion in information science. Part II: Nature and manifestations of relevance. Journal of the American Society for Information Science and Technology, 58, 1915-1933.
Posted by sunseed
   기본적으로 적합성 개념은 두 가지로 크게 분류될 수 있다(Saracevic 1975; Swanson 1986; Harter 1992; Schamber 1994). 하나는 객관적 또는 시스템 중심 적합성이고, 다른 하나는 주관적 또는 사용자 중심 적합성이다(Borlund 2003). 이러한 두 가지 분류는 속성뿐만 아니라 접근 방법에 있어서도 크게 다르다(Borlund 2003). 
시스템 중심의 접근 방법은 적합성을 정적이면서 객관적인 개념으로 보는 반면, 사용자 중심의 접근 방법은 적합성을 인지적 재구조화를 포괄하는 주관적인 개인의 정신 경험으로 본다(Swanson 1986).
                                                     표 1. 적합성 분류

시스템 중심 적합성 (System-oriented relevance)

  시스템 중심 적합성은 사용자의 검색어와 검색 시스템에 저장된 색인어와의 일치를 말한다. 이는 논리적, 주제적, 객관적 개념을 포함한다. Cooper는 논리적(Logical)적합성이라는 용어를 사용하였고 이는 사용자의 판단과는 전혀 상관 없는 적합성을 의미하였다. Cooper의 논리적 적합성에 기반하여 Park(1994)은 “주제적(Topical) 적합성은 사용자의 특정한 상황이나 요구와 상관없이 문서의 주제와 검색어의 고정된 관계”라고 하였다. 이와 비슷하게, Swanson(1986)과 Howard(1994)는 객관적(Objective) 적합성은 사용자의 요구보다는 시스템이 어떻게 검색어를 해석하는 지와 관련된 것이라고 하였다. 

  Swanson(1986)에 따르면, 일단 사용자가 입력하여 시스템으로 넘어온 검색어는 사용자의 요구와 더 이상 관련이 없다는 것이다. 즉 “사용자가 원하는 것이 아닌 실제로 검색어가 말하고 있는 것이다”(p.391-392). Howard(1994)는 이에 관해, 객관적 적합성은 “시스템 기반의 주제성 즉, 검색어의 내용이 응답 내용의 주제에 얼마나 잘 나타나 있는지로 측정된다”(p.172)고 하였다. 
Swanson과 Howard가 정의한 객관적 적합성은 검색어와 응답 내용과의 관계를 말한다. 이는 하나 이상의 단어를 포함하고 있는 모든 개체는 - 일반적으로 검색 시스템이 단어의 수와 빈도를 고려하긴 하지만 - 객관적으로 적합하다는 것을 의미한다. 그러나 사용자가 해당 개체가 자신의 정보 요구와 관련 있는지를 인식하는 것은 객관적 적합성을 계산할 때 고려되지 않는다(Maglaughlin & Sonnenwald 2002).

사용자 중심 적합성 (User-oriented relevance)

   논리적, 주제적, 객관적 적합성과 반대로, 사용자 중심의 적합성은 주관적, 상황적, 심리적 개념을 포함한다. Swanson과 Howard는 주관적(Subjective) 적합성은 사용자와 검색된 개체와의 관계라고 하였다. “사용자가 적합하다고 하는 것이 바로 적합한 것이다. 즉 사용자가 최종 결정자이다. 정보 검색 시스템은 단지 사용자를 위하여 존재할 뿐이다”(Swanson 1986, 390). 즉 주관적 적합성에서는
사용자가 검색된 개체에 대한 최종 가치 판단을 하는 것이다. 주관적 적합성 외에도, 연구자들은 중요한 적합성 관점으로 상황적 적합성과 심리적 적합성을 들었다. 
   Wilson(1973)은 상황적(Situational) 적합성은 사용자가 정보 요구를 인식하는 제반 환경을 포함하는 것이라고 하였다. 즉 “상황적 적합성은 사용자의 특정 상황에 대한 적합성이다. 여기서의 상황은 다른 사람이 보는 상황도, 실제 상황도 아닌, 본인이 보는 상황이다”(p.460)라고 하였다. 이러한 Wilson의 정의는 Swanson과 Howard와 마찬가지로 사용자만이 적합성을 정의할 수 있다는 것을 의미한다(Maglaughlin & Sonnenwald 2002).
   Wilson은 또한 심리적(Psychological) 적합성과 관련하여, 적합성을 판단할 때만이 아니라 판단 이후에도 사용자의 행동에 영향을 미치는 것을 연구하였다. Wilson은 심리적 적합성에 대해 “사람들이 정보를 어떻게 사용하고 어떻게 그들의 생각이 바뀌는 지와 같이 실질적인 사용 및 효과와 관련되어 있다.”(p.458)고 하였다. Harter(1992) 또한 심리적 적합성이라는 용어를 사용하였고 Swanson의 주관적 적합성과 비슷하게 정의하였다.

    최근 적합성은 객관적인 시스템 중심 접근보다는 주로 주관적인 사용자 중심으로 접근되고 있다(Borlund 2003; Cosijn & Ingwersen 2000; Mizzaro 1997; Saracevic 1975; Schamber 1994). 적합성에 관한 시스템 중심 접근은 실질적인 사용자 요구를 고려하지 못하는 한계를 가진다(Fruend 2008). 그리고 적합성 판단에 영향을 주는 상당수의 주관적이고 상황적인 변수들을 고려하지 못한다(Barry 1994). 
    사용자 중심 적합성 개념에 관한 연구는 1960년대 후반에 시작되었다. 1970년대와 1980년대에 행해진 많은 연구들은 적합성 판단이 사용자의 지식과 인식에 의존적이고, 적합성 평가가 사용자의 목적, 지식 수준과 믿음, 정보의 속성, 시간 제한, 정보 획득에 소요되는 노력과 비용 등과 같은 다양한 요인들에 영향을 받는 역동적 과정이라는 것을 보여주었다. 
    사용자 중심 관점에서 적합성은 정보 요구와 문서와의 관계에 대한 사용자의 주관적 인식이다(Borlund 2003; Cosijn & Ingwersen 2000; Mizzaro 1997; Saracevic 1975; Schamber 1994). Schamber, Eisenberg 와 Nilan(1990, p.773)은 “사용자가 정보를 평가하는데 사용하는 기준 등을 연구함으로써 적합성에 대한 더 구체적인 이해를 할 수 있게 됨과 동시에 시스템 디자인에도 도움을 줄 수 있을 것이다” 라고 하여 사용자 중심 적합성 연구의 중요성을 강조하기도 하였다.

  - 출처: 박정아 (2010), "정보검색에서의 사용자 중심 적합성 판단 모형 개발 및 평가"  

주요 참고문헌
  • Borlund, P. (2003). The concept of relevance in IR. Journal of the American Society for Information Science and Technology, 54, 913-925.
  • Harter, S. P. (1992). Psychological relevance and information science. Journal of the American Society for Information Science, 43, 602-615.
  • Howard, D. L. (1994). Pertinence as reflected in personal constructs. Journal of the American Society for Information Science, 45, 172-185
  • Park, T. K. (1994). Toward a theory of user-based relevance: A call for a new paradigm of inquiry. Journal of the American Society for Information Science , 45, 135-141.
  • Swanson, D. R. (1986). Subjective versus objective relevance in bibliographic retrieval systems. Library Quarterly, 56, 389-398.
  • Wilson, P. (1973). Situational relevance. Information Storage and Retrieval, 9, 457-469.
Posted by sunseed

 정보 검색의 주요 목적은 적합한 문서를 찾아주는 것으로, 적합성은 정보 검색의 핵심 개념이다. 적합성은 정보 검색 시스템의 기능과 평가에 있어 기본적이면서도 중요한 것으로 알려져 있다(Borlund 2003).

 그렇다면 적합한 정보란 무엇인가. 정보 이용자는 어떻게 문서가 적합하다고 인식하는가. 적합성은 정보 검색의 주요 연구 분야로서(Borlund 2003; Mizzaro 1997; Schamber 1994), 지난 50년이 넘게 끊임없이 논의되어 왔다. 그러나 적합성 개념은 아직까지 구체적으로 정의하기 어렵다(Toms et al. 2005).

 초기의 적합성은 정확률(precision)과 재현율(recall) 같은 시스템 중심의 개념으로 논의되었다. 그러나 시스템 중심의 적합성만으로는 적합성 개념을 충분히 설명하기 부족하다는 주장이 제기되면서 적합성 개념에 대한 논의가 재기되었다(Saracevic 1975; Schamber, Eisenberg, & Nilan 1990). 그리고 사용자 중심 관점의 연구가 활발해 지기 시작했다(Cosijn & Ingwersen 2000; Borlund 2003; Schamber et al. 1990; Saracevic 1970). 

 기존 연구들에 의하면 적합성은 복합적이고 다차원적이면서 또한 상황에 따라 달라지는 동적인 개념으로, 인지적, 정서적, 사회 문화적 요인들에 영향을 받는다고 알려져 왔다(Schamber 1994).
 정보 이용자들은 실제 검색과정에서 단지 ‘적합하다’/’적합하지 않다’가 아닌, 주관적이고 역동적으로 적합성을 판단한다(Kekäläinen, & Järvelin 2002).  이러한 의미에서 적합성은 다차원적이며 어떤 하나의 적합성만으로 정의될 수 없다(Cuadra, & Katter 1967b; Barry 1994; Saracevic 1975, 1997; Schamber 1994). Schamber, Eisenberg과 Nilan(1990, 774)은 이전 적합성 연구들에 기반하여 적합성 속성과 정보 행위에서 적합성 역할에 대해 3가지의 핵심 결론을 도출하였다.
  • 적합성은 사용자 인식에 기반하는 다차원적 인지 개념이다.
  • 적합성은 특정 시점에서의 사용자 판단에 기반하는 역동적인 개념이다.
  • 적합성은 복합적이기는 하지만 사용자 관점으로 측정 가능한 개념이다.

 많은 연구자들이 다양한 용어로 적합성 개념을 명시해 왔다. 예를 들어, Cooper(1971)는 “논리 적합성(logical relevance)”, Wilson(1973)은 “상황 적합성(situational relevance)”, Harter(1992)는 “심리 적합성(psychological relevance)” 등으로 정의하였다. Froehlich(1994), Park(1994), Green(1995), Mizzaro(1998) 또한 다양한 관점에서 적합성을 기술하고, 분석하였다. 이처럼 적합성에 관한 오랜 관심과 연구에도 불구하고 아직까지 적합성에 대한 구체적인 개념이나 속성에 대한 합의가 이루어지지 않은 상황이다.

"아무도 정보검색 시스템 사용자들에게 적합성이 무엇인지 설명하지 않는다. 심지어 그들이 적합한 문서를 찾기 위해 고군분투할지라도, 사람들은 직관적으로 적합성을 이해한다." (Saracevic 1996, p.215)

             - 출처: 박정아 (2010), "정보검색에서의 사용자 중심 적합성 판단 모형 개발 및 평가"  
  
Relevance에 관한 주요 참고문헌.

  •  Borlund, P. (2003). The concept of relevance in IR. Journal of the American Society for Information Science and Technology, 54, 913-925.
  • Kekäläinen, J. & Järvelin, K. (2002). Evaluating information retrieval systems under the challenges of interaction and multidimensional dynamic relevance. In: Bruce, H., Fidel, R., Ingwersen, P. & Vakkari, P., eds. Emerging Frameworks and Methods, Seattle, 2002. Colerado: Libraries Unlimited, 253-270.
  • Mizzaro, S. (1997). Relevance: The whole history. Journal of the American Society for Information Science , 48, 810-832.
  • Saracevic, T. (1975). Relevance: A review of and a framework for the thinking on the notion in information science. Journal of the American Society for Information Science, 26, 321-343.
  • Saracevic, T. (1996). Relevance reconsidered '96. In P. Ingwersen & N.O. Pots (Eds.), Second International Conference on Conceptions of Library and Information Science (CoLIS2) (pp. 201-218). Copenhagen: Royal School of Librarianship.
  • Schamber, L. (1994). Relevance and information behavior. In M.E. Williams (Ed.), Annual review of information science and technology (ARIST), 3-48. Medford, NJ: Learned Information, Inc.
Posted by sunseed
검색어 입력할때마다 검색 결과를 바로바로 보여주는(shows results as you type) 
구글 Instant Search.

Google Instant: The Complete User’s Guide 에 의하면
현재 구글 계정으로 로그인했을때만 작동하고
Domain이  US, UK, France, Germany, Italy, Spain, Russia인 경우,
브라우저는 Chrome v5/6, Firefox v3, Safari v5 for Mac, Internet Explorer v8
에서 보여진다. 모바일에서는 아직 지원되지 않는다.

Google Instant is starting to roll-out to users on Google domains in the US, UK, France, Germany, Italy, Spain and Russia who use the following browsers: Chrome v5/6, Firefox v3, Safari v5 for Mac and Internet Explorer v8.


Google이 말하는 Google Instant Search 3가지 장점

1. 빠른 검색  (Google research에 의하면 검색당 2-5초 절약)
2. 스마트한 예측으로 사용자 검색을 도와주고 가이드 해 줌
3. 검색버튼이나 enter 클릭없이 바로 보여지는 검색결과
Google says there are three benefits to using Instant: faster searches (it saves 2-5 seconds per search according to Google research), smarter predictions that help guide user searches, and instant results that let the searcher see results without clicking a search button or pressing enter.


Localized, Personalized, 안전하지 않은 컨텐츠는 Filtered 된 Google Instant Search.
검색광고나 PPC같은 SEO에의 영향 등 여러 곳에서 예의주시하고 있는 상황.

검색버튼이나 enter 클릭되는 검색어에는 확실히 영향을 미칠 것이고.
사용자 검색 행동(User search behavior)에도 분명한 변화가 있을 것으로 보여진다. 

참고.  Matt cutts이 말하는 Google Instant Search

Posted by sunseed
벌써 까마득하게 느껴지는 여름 휴가
다녀온지 딱 한달쯤 된 것 같다.

8.6~10일 3박 5일 중국 하이난(Hainan)으로 여름 휴가 기록

한창 작업해 온 서비스 오픈 후, 이때 아니면 못 갈것 같아 급히 알아보고 출발 이틀 전 예약하고 바로 다녀왔던 여행이다.
예상대로 나름 스펙타클했던 8월을 보내고 9월을 맞아 이제서야 간단하게 휴가 후기를.
 
중국 하이난(해남도)은 중국에서 가장 남쪽에 있는 섬으로 우리나라로 치면 제주도랑 비슷한 곳이다. 크기는 제주도에 비해 13배쯤 크다고 들은 것 같다.

휴양지이고 적당한 관광도 할 수 있어 머리 비우고 충전하려던 이번 휴가 목적에 딱 맞춤이었다.

지은지 1년 되었다는 삼아국제호텔도 깨끗했고,

14층에서 바라보이던 하늘과 바다 전경도 멋졌다.

대동해 해변에서의 한가로운 오후 나절 책과 함께 일광욕,

장미꽃탕, 인삼탕, 커피탕, 밀크탕 등 수십개의 주강남전 자연속 노천온천에서의 평화로운 반나절,

원숭이섬을 오고가는 케이블카에서의 시원한 바람도 잊지 못하겠고.

녹회두에서 내려다 본 삼아시내 야경도 기억에 남는다.


가이드도 참 잘 만났고,
일행들도 참 잘 만나서 더욱 기억에 남는 여행.

가족들이 가면 함께 보낼 시간이 많아 좋을 것 같다.
휴양지에서 쉬고 싶은데 멀리 가기 부담스러울 때 가기 괜찮은 여행지라는 생각.

Posted by sunseed
◀ PREV : [1] : [2] : [3] : [4] : [5] : ... [69] : NEXT ▶

BLOG main image
결국은 사람 by sunseed

카테고리

분류 전체보기 (686)
검색/IT (79)
인지과학/HCI (44)
read things (43)
work life (20)
research (3)
일상다반사 (61)
마음이 울리다 (76)
말, 말, 말 (32)
좋을텐데 (0)
My Digg (0)
Today's attention (9)
life log (3)
private (0)
social network (0)
영화 (3)
여행 (2)
문화생활 (0)

달력

«   2012/01   »
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31        

글 보관함