Vivisimo: 클러스터링 서치 엔진

Slashdot에서 구글에 대한 글을 읽다가 우연히 알게된 검색 서비스: vivisimo. 누군가 감히 구글보다 나은 검색 서비스라고 하길래 뭘 갖고 그렇게 얘기하는지 궁금해서 한번 가봤다. 그 전에 내가 갖고 있는 선입견 한가지: “누군가 구글의 페이지 랭킹보다 더 나은 알고리즘을 개발한다고 한들, 충분한 재력이 있는 글로벌 기업이 아닌 이상 방대한 인터넷의 웹 페이지들을 인덱싱하는 것조차 어려울 것이므로 결과적으로 현재의 구글보다 나은 검색 결과를 보여줄 수는 없다"는 것. 과연 검색 결과의 완전성이나 랭킹의 적절성이라는 면에서 보면 아직 구글만 못한 것 같았지만, 클러스터링이라는 새로운 방식에 의해 결과를 보여주는 것은 참신했다.

간단한 테스트를 해보기로 했다. 일단 내가 비교적 잘 아는 분야에 대해 어떤 식으로 클러스터링을 하는 지 보기 위해 “wireless internet"을 입력해봤다. 결과는 위의 그림. 엇쭈, “WAP"과 “Hotspot"을 각각 클러스터링 주제로 택한 걸 보면 뭔가 알긴 하는 듯. 물론 이 분야의 전문가들이 할 법한 분류를 해내지는 않았지만 자동으로 이 정도 하는 것은 신통했다. 그 다음 “search engine"을 한번 검색해봤다. 역시 그럴싸하게 분류해낸다. 자기네 검색 결과에 의하면 vivisimo 자신은 19번째로 간신히 첫 페이지에 올라온다. 구글에서 같은 검색을 해보면 37번째에 vivisimo가 나온다. 재밌는 것은 구글에서 “search engine"을 검색해도 구글이 첫번째로 나오지 않고 세번째로 나온다는 점. 구글이나 vivisimo나 모두 첫번째는 Search Engine Watch이다. 아직 한글 처리 문제등 미숙한 점이 보이고 전반적인 검색 성능은 구글보다 좀 떨어지는 것 같지만, 주제에 따라 클러스터링하는 것은 유용한 경우가 꽤 있을 것 같다. 물론 구글도 구글 뉴스에서 보여주듯이 누구 못지않은 클러스터링 기술을 갖고 있다. 하지만 그 기술을 마땅한 수익 모델도 없는 뉴스 서비스에 적용해놓고도 검색에 적용할 생각은 적어도 vivisimo보단 늦었던 것 같다. 과연 vivisimo와 같은 회사가 구글과 MS와 같은 공룡들, 또 네이버와 같이 특정 국가에 특화된 검색 서비스들의 틈새에서 일반 용도의 B2C 서비스로 살아 남을 수 있을까?