좋은 데이터 분석(Data Analysis) 강좌 발견하여 공유. Coursera 좋은 강좌 많네요. 영어가 좀 걸리긴 하지만, 영어 공부한다 생각하고 도전해도 괜찮을 듯.

Coursera 아직 직접 들어본 적은 없는데, 이런 강좌들 보니 앞으로 교육 형태의 변화 실감되면서 관련 기사가 생각나고,
- “5년 안에 새로운 교육을 받게될 것” 온라인 교육시장의 리더, 코세라의 사례로 보는 미래의 교육 산업 (http://platum.kr/archives/15670)

IBM 이 예측한 5년 후 우리 삶의 변화 중 교육의 변화도 생각이 나구요. 
- "클라우드·소셜·빅데이터 기반 시스템… 5년 후 우리 삶 바꾼다" (http://review.chosun.com/site/data/html_dir/2013/12/18/2013121803538.html?outlink=twitter)

그러고 보니 둘 다 5년 후네요. 5년 후엔 어떤 변화 있을지 정말 궁금. 

데이터 분석(Data Analysis) 관심 있는 분은 위의 Coursera 강좌 교수인
존스 홉킨스의 Jeff Leek 교수가 수업 자료 공개했으니 참고하시고,
- 강의 동영상(http://bit.ly/16PPtuI)
- 강의 자료(https://github.com/jtleek/dataanalysis)

데이터 분석 소개하는 짧은 동영상 맛보기로 보셔도 좋을 듯. 
http://simplystatistics.org/2013/01/10/the-landscape-of-data-analysis/

Posted by JulieNJulia
:

버클리 대학의 검색 수업 (2007)

HCI 분야 및 검색 사용자 인터페이스(searchuserinterfaces.com)로 유명한  Marti A. Hearst(http://people.ischool.berkeley.edu/~hearst/) 교수가 주관한 수업으로

수업명은 "Search Engines: Technology, Society, and Business"로

아래 링크에서 볼 수 있다. 

http://courses.ischool.berkeley.edu/i141/f07/index.html

수업 내용 구성을 보면 알겠지만,

검색 기본 개념 보다, 야후, 구글, MS 등 현업 종사자들이 검색 이슈들에 대해 이야기하는 내용으로,

생생한 검색 이슈들을 접할 수 있다.  


Posted by JulieNJulia
:

며칠 전에 구글의 의미 검색 관련 기사를 보고 정리하고 있었는데, 오늘 구글의 지식 그래프(Knowledge Graph) 런칭 소식.

지식 그래프(Knowledge Graph)는 구글에서 이야기 해 온 Semantic Search나 Universal Search 기본적으로 같은 개념을 바탕으로 한다. 

우선, 여러 의미를 가진 검색어에 대해 명확한 것을 찾을 수 있게 해 주는 것. 

예. "Andromeda"라고 검색했을 때, 별자리인지, TV 시리즈인지, 것도 아니면 음악 밴드인지 쉽게 찾을 수 있게 해주는 것. 

또 하나는 검색어에 대한 결과를 링크로만 제공하는 대신 관련 정보들을 잘 정리해서 보여 주고 연결 고리를 제공해 주는 것.

예. "Marie Curie"를 검색했을 때, 관련 링크와 더불어 퀴리 부인과 관련된 다양한 정보들의 링크를 정리해서 보여주는 것.

Knowledge Graph는 웹페이지간의 링크에서 개체(entity, 사람, 사물 등)들 간의 링크 개념으로 발전한 것으로 이해하면 될 것 같다.

검색은 점점 사람들에게 정보를 "얼마나 잘 떠먹여 줄 것이냐"의 경쟁으로 가고 있고,
(사람들이 얼마나 직관적이고 편하게 사용할 수 있느냐는 비단 검색만은 아니겠지만)

구글 의미 검색에 관해서도 이야기 했지만, 사실 네이버나 다음과 같은 국내 통합 검색에서는 일부 이미 구글에서 말하는 형태로 보여주고 있다고 볼 수 있다. 예) "이효리", "이효리 나이는?". 

그러나 결국은 데이터 구축이 관건이고, 이것을 어떻게 기술적으로 잘 풀어서 커버리지를 늘려갈 것이냐가 핵심.

요새 말 많은 빅데이터도 결국 수많은 데이터들을 기술적으로 잘 분석해서 어떻게 "의미"를 뽑아낼 것이냐가 핵심인 것이고, 구글이 하고 있는 방식이 좋은 예라고 보면 될 것 같다. 

어쨌든 조용한가 싶더니 꾸준한 구글.  

Knowledge Graph 소개 동영상 링크 

관련기사

Google Just Got A Whole Lot Smarter, Launches Its Knowledge Graph

CNN의 제목이 흥미롭다 

Google search to become more human


Posted by JulieNJulia
:

구글이 의미 검색(semantic search)을 활용하여 검색을 개선하고 있다는 기사 (원문: Google Gives Search a Refresh)


기사에 의하면 구글의 semantic search는,

1. 먼저 검색어를 사람, 장소, 물건 등과 같은 수백만 entity들과 잘 매치해 주는 것. 

예를 들어, "타호 호수(Lake Tahoe)"를 검색하면 관련 링크 리스트만 보여주는 현재 방식 대신, 타호 호수의 위치, 고도, 평균 온도, 염분등과 같은 주요 속성들도 함께 보여주는 것. 

2. 또 하나는 "What are the 10 largest lakes in California?" 와 같은 질문형 검색에 링크보다는 직접적인 답을 주는 것.

현재 구글은 웹검색에서 뒤따르는 MS를 견제하며 선두를 지키고 있고, 애플의 모바일 음성 검색 Siri를 쫓고 있으면, 상품 검색(product search)과 같은 니치마켓에서 라이벌과 싸우고 있는 상황.

의미 검색을 통해 사람들이 twtitter나 facebook 과 같은 소셜 네트워크 서비스에서 보다 검색에 머무르는 시간이 늘어날 것이라 기대하고 있고,

2010년에 이미 1200만 정도의 entity를 가진 Metaweb Technologies를 인수하여 (위키피디아의 영문 entity가 350만 정도) 웹으로부터 정보 추출 알고리즘(extraction algorithms)을 사용하여 현재 2천만 가량의 entity를 보유하고 있다고 한다. 

이는 지난달 나온 구글의 검색 변화 내용 중 "Universal Search" 부분과도 일맥상통하는 내용이기도 하다 (참고: Breaking Down 50 New Google Search Changes).

구글이 얘기하는 의미 검색은, 사실 국내 통합 검색에서는 이미 어느 정도 그렇게 "보여"주고 있는 방식이기도 하다. 예) "이효리", "이효리 나이는?". 

문제는 이 커버리지를 확대해 가는 '방법'이고, 이걸 얼마나 '기술적으로' 잘 풀어갈 것이냐가 관건인 것. 

구글이 어떤식으로 풀어갈지, 어느 정도까지 보여줄지 기대된다.

Posted by JulieNJulia
:

쇼핑 검색 동향

2012. 5. 7. 19:28

이베이와 월마트의 상품 검색(Product Search)

이베이와 월마트가 아마존에 대응해서 검색 엔진을 개선하고 있다는 소식.

1. 이베이

이베이는 카시니(Cassini)라는 새로운 검색엔진을 준비 중이다. 

현재 검색엔진인 보이저(Voyager)는 10여년전에 만들어졌고,
2008년에 CTO로 취임한 Mark Carges가 "iPod" 검색결과로 iPod어댑터가 탑 검색 결과로 뜨는 것을 보고 경악하여,

이후 MS Bing의 엔지니어등을 영입하여 150명 가량으로 3배가량 엔지니어를 늘려서 새로운 검색 엔진을 준비 중인 상황.

보이저(Voyager)가 상품의 제목 위주로만 검색하는 형태로 직관적이지 않고 literal 하였다면, 

카시니 (Cassini)는 검색어를 이해하는 방향으로, 구체적으로 다음과 같은 특징을 가진다.

      • 상품 제목만이 아닌 상품 옵션이나 설명(description)도 전체 검색  
      • 쿼리와 상품 사진 매칭
      • 판매자와 구매자에 대한 정보 고려 
      • 과거 구매한 히스토리와 브라우징 히스토리 데이터를 이용해서 좀 더 의도에 맞춤 검색 
        • 예를 들어, 쇼퍼가 "HP"라고 검색어 입력했을 경우, 이것이 horsepower 를 의미하는지 Hewlett-Packard Co,를 의미하는지 알 수 있게 되는 것. 
이베이의 온라인상의 수많은 가치있는 정보들, 판매자 정보 등 그러나 구조화되지는 않은 정보들을 이용하는 것이라 이 검색 엔진 프로젝트는 시간이 좀 걸릴 것이고, 2013년도에 선보일 예정이라고 한다. 

2. 아마존 

반면 아마존은 상품을 카탈로그화는 방향이다. 검색이 잘 될 수 있도록 데이터를 구축하는 일, 즉 상품을 잘 정리하고, 상품 설명을 잘 기술하는데 힘쓰고 있다. 

3. 월마트

월마트는 이미 새로운 검색 엔진을 런칭했다. 10~15명이 9달이 채 안 걸리는 시간 동안 작업했고, 

검색어가 상품명에 정확히 매칭하는 것보다, 사람들이 실제로 사용하는 용어들이 함께 검색될 수 있는 것에 힘썼다. 

예를 들어 "backyard chair" 검색할 때 patio chair 나 garden chair 도 같이 검색되는 식이다. 

4. 구글

이베이와 월마트의 검색 개선은 구글 입장에서 좋을 리 없다. 사람들이 물건을 살 때 구글에서 검색하는 대신 바로 이베이나 월마트로 이동하게 되면 상품 광고에 타격을 줄 수 있기 때문.

구글 또한 상품 검색(product search)에 힘을 쏟고 있는데.
최근에는 시각 인식 기술 (visual-recognition technology)을 이용해서 패션 카테고리 쪽 상품 검색을 개선했다. 
예를 들어 "red dress" 와 같은 검색 결과를 제공하고,  
검색 결과에서 드레스 모양에 따른 필터링(예. 나시, 엠파이어 , V넥, 라운드넥 등)이 가능하다 

역시 아직 상품 검색, 쇼핑 검색은 아직 할 것들이 많이 있고, 매출과도 관련있다 보니 다들 상품 검색에 힘을 쏟고 있는 상황.

정리하면 이베이구글은 기술로 접근, 아마존카탈로그 데이터 구축, 월마트동의어를 확장한 접근이고, 이베이가 제대로 한다면 빅 데이터 활용의 좋은 예를 보여줄 수 있을 듯. 





Posted by JulieNJulia
:

Interactive Information Retrieval은
정보검색에서 좀 더 사용자(user)측면을 강조한 것으로, 
 

주요 이슈는 
-  사용자 검색 니즈와 검색어 의도 분석 (
information needs and query intent)
-  정보 검색 행동 모델  
ex. Bates' Berrypicking, Dervin's sense-making theory 등
-  검색 사용자 인터페이스 ex. 검색결과 프리젠테이션 
-  사람들이 어떻게 검색 품질이나 검색 시스템을 평가하는지 
등이 있다. 

지난달 토요인지모임에서 발표했던 "Interactive Information Retrieval" 발표자료.
Interactive informationretrieval 토인모_201202
View more presentations from Jungah Park 

 발표자료에는 
- Interactive Information Retrieval
- Models of Information Seeking Behavior
- Evaluation of Interactive Information Retrieval Systems with Users
- Relevance in Information Retrieval
- Search User Interfaces  
등의 내용이 포함되어 있다.  



 
Posted by JulieNJulia
:
큐레이션 읽고 또 얘기하며 든 생각 몇 가지 정리.

* 짤막한 글이나 링크 공유를 통한 큐레이션 @ <허핑턴 포스트>와 링크 경제의 출현
자기표현은 새로운 오락거리 입니다. 사람들은 단지 정보를 소비할 뿐 아니라 참여하고 싶어하죠. 이러한 욕구를 파악하는데 저널리즘의 미래가 있어요.
 이미 웹 2.0에서 UGC(User Generated Contents)또는 UCC(User Created Contents)로 사용자 참여는 이미 꽤 되었지만,     재미있었던 건 꼭 뭔가를 창조(만들어)내는 것 보다 있는 것들을 셀렉트해서 공유하는 현상을 큐레이션이라는 개념으로 의미를 부여하고, 또 큐레이터로서 인간의 역할을 부각한 포인트.
뭔가 하나의 글로 잘 정리하는 블로깅보다 보거나 들은 것 중 인상깊은 링크들을 간단하게 트위터나 페이스북 통해 공유하게 되는 내 경험을 봐도 그렇고.
이는 짤막한 글이나 링크 공유를 편하고 간단하게 해주는 소셜 플랫폼의 영향도 있을 터이다.
따지고 보면 다음이나 네이버와 같은 포털 사이트들은 궁극의 큐레이션 집합체.
 
  • * 인간의 요소, 인간만이 -
패턴을 인식하는 인간 고유의 능력 @ <큐레이션, 인간을 지향하다> 
"프로그래머와 큐레이터로서 인간의 역할이 사라지는 일은 일어나지 않을 거에요. 컴퓨터가 절대로 따라올 수 없는 부분이 있으니까요. 그게 바로 인간의 요소, 인간만이 떠맡을 수 있는 부분이죠"
대학원 수업, 아마도 질적연구방법론으로 기억한다.
인간의 눈만큼 강력한 통계툴은 없다고 하신 교수님 말씀이 인상적이었다. 방대한 인터뷰 자료들, 텍스트들에서 의미를 찾아내는 것은. 그 자료들을 분석해 보고 있으면 찾아낼 수 있는 패턴.

의미를 부여하는 건 인간 고유의 능력이라고.
의미를 부여하고 정의하는 인간의 능력은 대체할 수 없을 것.

이것은 검색 랭킹 모델링 업무를 할 때도 느꼈던 것이기도 하다. 
구글로 인해 기계나 데이터가 중요하고 사람의 시선이나 관점은 bias라고 생각하는 의견들도 있었는데, 사실상 design하는 것은 결국 사람이고 기계나 데이터를 이용하여 검증해 내는 게 필요한 것.

사실 백여개가 넘는 랭킹 요소를 사용한다는 구글에서도 패턴이나 의미를 볼 줄 아는 "사람"(구글이나 야후의 research scientist) 이 없으면 방대한 데이터는 크게 의미 없거나 정말 많은 시간을 필요로 하는 것이다. 요는 기계가 사람이 모르는, 정의할 수 없는 의미까지 찾아내 주기는 어렵다는 것.

최근에 화제가 되고 있는 빅데이터나  빅데이터 전문가에 대한 이야기도 같은 맥락이라고 생각한다.
빅데이터를 저장하고, 분석해서 의미를 찾아내어 새로운 트렌드에 대한 통찰을 뽑아내고자 하는 것에서, 어떤 것을 분석해서 의미를 찾아낼 것인가가 관건. 잘 분석하기 위해 저장도 쉽지 않겠지만, 어떤 부분을 분석해서 어떤 흐름(패턴)을 찾아낼 것인가. 그게 진검승부 포인트가 될거란 생각. 
알고리즘은 대량의 자료를 수집하는 데 유용합니다. 어떤 글이나 동영상을 몇 명이나 보는지 계속 지켜보면서 숫자, 링크. 클릭수, 리트윗수 등을 계산하기에 적합하죠. 여기에서 인간은 경쟁이 안됩니다. 대신 인간의 뇌는 패턴을 인식할 수 있죠. 우리는 길 건너 나무를 보고 바로 그게 나무란 걸 알 수 있어요. 그러나 컴퓨터는 몇 시간 동안 나무 이미지를 보고 상당한 처리 시간을 거쳐야만 그게 나무란 걸 인식합니다. 그때 이미 우리는 그게 소나무이고 말라 죽어가고 있다는 사실까지 파악해내죠.
 
마지막으로 한줄평.  
  • 없지 않았던 행위들, 새롭지 않은 개념들을 “큐레이션", 결국은 “인간”의 요소로  정리해서 생각해 보게 하는 것이 굿 포인트. 새로운 내용이나 제시에 대한 큰 기대보단.
 
Posted by JulieNJulia
:
회사에서 로컬 장소 검색 품질 평가 항목 만들다가 찾은 

구글 검색 품질 평가 자료 찾은 내용 간단하게 공유합니다. 


구글은 전세계 곳곳의 Human evaluator들을 선발해서 검색 품질 평가를 하고 있고 (http://allthingsd.com/20090603/google-and-the-evolution-of-search-scott-huffman/)

역시 구글답게 장장 125 페이지에 이르는 품질 평가 가이드 라인에 맞춰 평가하도록 교육하고 있습니다.


간단하게 보면, 


쿼리를 일반적으로 알려진 아래의 3가지 분류해서 

* Navigation Queries – “Go” : 홈페이지나 사이트 찾아가는 니즈 쿼리. 우리로 치면 바로가기, 사이트성 

* Action Queries – “Do”, : 다운로드 받거나 물건을 사는 등등의 액션을 취하기 위해 검색하는 니즈. 

* Information Queries – “Know”, : 일반적인 정보 찾는 니즈.


대략 다음과 같은 scale 로 평가합니다.

* useful     : 매우 유용

* relevant  : 유용

* slightly relevant  : 약간 유용

* off-topic / useless : 관련없거나 전혀 유용하지 않음.


이외에 공식 홈페이지에 대해서 "vital" 스케일로 별도 평가하고,

스팸(Not Spam, Maybe Spam, Spam)이나 음란/악성 여부(Porn, Malicious)를 별도 플래그로 표시합니다

 


일반적인 웹검색 평가 기준이라 한국의 통합검색이나 로컬 등 버티컬 검색 평가 기준에 아주 들어맞지는 않지만, 체계성과 정교한 가이드는 역시 구글이네요.  

참고)
구글 검색 품질 평가 관련 예전 글
Google and the Evolution of Search

구글 검색 품질 평가 방법 (How Google Measures Search Quality)


Posted by JulieNJulia
:

올해 2월 검색 컨퍼런스, 그리고 지난주 '검색의 미래' 세미나에서 발표한 내용 중 

"소셜 검색" 정리


twitter, facebook과 같은 SNS(Social Network Service)로 인해 “소셜"이란 용어가 주요 키워드로 급부상하였는데,  

그렇다면 소셜 검색이란 무엇일까.
 

"소셜"이란 용어자체가 광범위하다 보니 소셜 검색이라는 용어도 다양한 의미로 사용되고 있다.


1. SNS Search - Social Network Service 데이터를 검색해 주는 것
 

단순하게는  Social network service 상의 데이터, 트위터, 페이스북, 미투데이등과 같은 데이터를 검색해주는 것도 일종의 소셜 검색이라 부를 수 있다.  
 

ex) 다음 소셜웹 검색 (http://goo.gl/JrBqG)


참고) SNS 로 인한 실시간 검색 (Real Time Search) 트랜드 

SNS  서비스 특징은 문서라기 보다는 짧은 글들이고, 이슈 확산이나 공유가 쉽고 빠르기 때문에 이로 인한 실시간 검색(real time search) 니즈도 급격히 커진 것도 사실이다.


다음이나 네이버에서도 분, 초 단위로 검색결과를 실시간 업데이트해주는 기능을 제공하고 있다. 

ex) 다음 실시간 검색 (http://goo.gl/GWzjK)


구글도 사람들이 최신 내용을 검색보다는 트위터나 페이스북에서 확인한다는 고민에서 출발해서, 올 11월 검색 랭킹 알고리즘에서 최신성을 강화하기도 하였다.
("Google Freshness Algorithm Update"
 - http://goo.gl/AQ8Ls) 


 2. Collective Social Search - Social Network Service 에서 화제가 되는 내용을 찾아주는 것.


SNS 서비스 특징은 retweet, like 등 이슈 확산이나 공유가 쉽고 빠르다는 것이고,

이렇게 SNS상에서 이슈나 화제가 되는 내용을 찾아서 보여주는 것도 하나의 소셜 검색으로 볼 수 있다.

일테면 집단지성과 같이 다수가 만들어 내는 흐름. 
 

 ex) 다음 화제의 글 검색 (http://goo.gl/VcvRT)


3. Friend-Filtered Social Search - 친구가 추천해 주는 검색 결과


내 친구, social network 상의 관계 정보를 검색에 이용하여 필터링하거나 검색결과에 신뢰도 정보로 제공해 주는 것.


ex) facebook의 like 를 검색해 주거나 이를 검색결과에 표시해 주는 Bing 검색이나 Blekko 등의 서비스.

gg+ 에서 공유한 내용을 검색결과에 표시해 주는  google 검색.


다음도 로그인 해서 검색했을 경우,  내가 가입한 카페나 블로그 검색결과를 별도로 보여주는 "마이 소셜 검색" 결과를 제공한다.


4. Q&A Search - 질문에 대해 사람이 직접 답해 주는 것
 

사람이 직접 알려준다는 측면에서 Humanized Search 라고도 불리고, 일종의 Collaborative search 라고 볼 수도 있다. 
 

우리나라에는 일찌감치 지식검색으로 유명해졌지만, 해외에서는 여전히 인기있고, 많은 서비스가 생기고 있다.  Q&A 검색에서는 사람의 신뢰도가 중요한 정보.

인기를 얻고 있는 Quora의 경우  "We're developing an algorithm to determine user quality" 힘쓰고 있다고도 하였다. 


ex) 네이버나 다음의 지식검색 , Yahoo answers, Aardvark, Quora 등 



다양한 의미로 사용될 수 있는 "소셜 검색"에 대해, 크게 이 정도로 나누어 볼 수 있을 것 같다. 

소셜 검색에 대해서는 다음 링크들 참고.

3 Flavors of Social Search

'Natural' Search User Interfaces


Posted by JulieNJulia
:

Google places 어플 아이폰 지원, 나와 친구들의 취향에 맞는 장소를 추천해 주는 Google Hotpot에 이어 이제는 foursquare와 같은 Checkin 기능도 선보이는 구글.

관련 링크 : Google’s Mobile Moves Tighten Its Grip On Local

1. Google Places 어플

현재 위치 중심으로 주변 장소들을 보여주고, 평가할 수 있음

무엇보다 바로 주변 음식점, 카페, 술집 등을 선택해서 볼 수 있는 점이 좋음.

그리고 “Directions to here”로 바로 찾아 볼 수 있게 되어 있는 점과.

 


 
이것 때문에 음식점 찾아갈 때 바로 사용해 보게 되더라는. (다른 어플 맛집에서 음식점, 술집 골라내기 불편해서)

 이처럼, 모바일에서는 기능은 다 있어도, 어떻게 접근 경로를 잘 만들어 줄거냐(사용성)가 특히 더 중요.


 관련링크 : Now available: Google Places with Hotpot for iPhone

2. Lattitude에 체크인 checkin 기능 탑재


다른 서비스들 보다 좀 더 강화된 Check in/out 기능들 - 도착할 장소에 reminder를 보내거나, 자동check in/out 등 - 반면,  아직 새로운 장소를 추가할 수 없고(Google Places 에 등록된 장소들만 가능), twtiter나 facebook으로 공유할 수 없으며, 무엇보다 현재 Android만 가능하고 아직 iphone을 지원하지는 않음.

관련 링크 : Google Finally Adds Check-Ins To Latitude, With A Couple Twists

3. Google Hotpot

나와 친구들이 평가한 장소들을 기반으로 장소 추천해 주는 Google Hotpot.
내가 많이 평가할 수록, 내 취향에 맞는 장소를 더 많이 추천.

Hotpot정보들은 Google Places 검색 결과에 활용됨. 즉 친구들이 추천하는 장소, 나에 맞춤 장소 검색 결과를 구분해서 볼 수 있음.

Posted by JulieNJulia
:

BLOG main image
결국은 사람 by JulieNJulia

카테고리

분류 전체보기 (702)
인공지능 AI (3)
read things (47)
work life (20)
검색 IT (86)
인지과학 HCI (46)
research (3)
일상다반사 (61)
마음이 울리다 (76)
그림 Drawing (1)
말, 말, 말 (32)
좋을텐데 (0)
My Digg (0)
Today's attention (9)
life log (3)
private (0)
social network (0)
영화 (3)
여행 (2)
문화생활 (0)

달력

«   2025/01   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31

글 보관함

최근에 올라온 글

최근에 달린 댓글

최근에 받은 트랙백