남군의 상식알리미

네이버의 리브라 (libra) 엔진 도입을 통한 포털 검색의 전망

힘쎈북극곰 2012. 11. 28. 11:04


2012년 11월 27일, 네이버에서 자사 검색 엔진에 반영되는 각종 웹문서의 경우, 각종 바이럴과 홍보에 의한 컨텐츠 신뢰도 부분에 지적을 받아왔는데, 이에 대한 불만들을 개선하기 위한 수단으로 리브라를 도입하겠다는 방안을 내놓았습니다.


리브라가 뭔지 궁금해서 찾아봤는데, 대략 이런 뜻을 가지고 있네요.


# 1. 

천칭자리(天秤-,Libra [ˈliːbrə], 기호: ♎)는 하늘의 적도 부근의 별자리로, 황도12궁 중 하나이다. 처녀자리와 전갈자리 사이에서 찾아볼 수 있다. 천칭자리에는 1등급의 별이 없으며, 한 때는 전갈자리의 집게발이기도 했다. 동아시아의 별자리에서는 청룡의 세 번째 별자리인 저수에 해당된다.


# 2. 

£ 또는 ₤는 통화기호 가운데 하나로, 파운드 기호 또는 리라 기호라고 부른다. £는 리브라(libra)의 첫 글자인 L에서 유래되었다. £는 주로 영국 파운드의 통화기호로 사용되고 있으며 1999년까지는 이탈리아 리라와 아일랜드 파운드의 통화기호로 사용되기도 했다.


출처 - 위키백과 발췌



천칭자리를 LIBRA라고 부르기도 하고, 또 화폐단위 리라도 연관이 있었네요. 

LIBRA에 대한 해외 사례가 있나 찾아봤는데, 거의 전무한 수준입니다. Microsoft 사에서 엔진 관련해서 언급된 페이지는 있네요.


http://synthese.wordpress.com/2009/05/19/ms-libra-academic-search-engine/


NHN에서 어제 발표된 내용들을 간략히 요약해봤습니다.


네이버 리브라 도입 이유


1. 원본이 아닌 자료가 상단을 잡는 문제 (불펌, 짜깁기등의 컨텐츠 자료)

2. 거대해진 데이터들 속에서, 일종의 버티컬 플랫폼으로 활용하기 위한 초석다지기.

->네이버 블로그 검색부터 순차 적용 예정, 신뢰도가 낮은 맛집 키워드 부터 시작 할 예정



신뢰성 판단기준


1. 활동성 평가 요소

블로그 활동 기간, 이용자 클릭 수를 통해, 만족도 평가 기준으로 삼겠다.
-> 검색어와 맞물린 포스트 몇 개만 따져 노출 순위를 매기지 않고 해당 블로거의 활동 내용까지 반영하겠다 라는 것 (네이버 블로거 기준 블로거들간의 이웃 활동내역 등)


2. 어뷰징 판별 요소

이런 평가 요소를 조작해 순위를 높이려는 패턴 보일시, 제외


-> 꾸준한 포스팅과 상위 검색어 분석을 통한 컨텐츠 키워드 반영, 즉 신뢰성,독창성,이용자 선호도가 높아 검색 결과에 정상적으로 노출될수 있도록 신경을 써야 할 듯 합니다.

즉, 이와 같은 패턴으로 운영해온 기존 파워블로거들의 독주 예상, 질 좋은 콘텐츠를 위한 경쟁이 치열해질 것으로 예상되네요. 똑같은 맛집이더라도 PV가 높은 곳이 좋은 컨텐츠로 반영되는 것이지요 ^^;



이에 대해 NHN이 리브라 엔진 관련하여 문서 가이드라인 공개 예정 이라고 합니다.


불법성,기계적 생성,클로킹(검색엔진에서 인식되는 내용과 실제 사용자 방문시의 내용이 전혀 다른 경우) 등으로 검색 노출에서 제외되는 유해·스팸 어뷰징문서의 자세한 조건들이 소개


EX) 포토샵, 오피스 관련 유입을 통해 애드웨어를 포함한 첨부파일or 웹하드 서비스 유도등의 악질 콘텐츠는 필터링 대상이 되겠지요.


요즘 빅데이터 시대에 따른 데이터 큐레이션과 버티컷 플랫폼 등에 대해 데이터 마이닝에 관심이 대두되고 있는데, 포털 내 LIBRA 검색엔진 도입에 따른 포털검색 플랫폼은 어떻게 변화할지 이에 대한 콘텐츠를 활용할 수 있는 플랫폼이 비즈니스 아이템으로 대두되지 않을까 싶습니다.