새로운 형식의 검색엔진 쿨, 구글에 도전장을 내밀다..
2008/07/29 09:30
|
Other IT Topics/Google
구글에 대항하는 새로운 검색엔진이 나와서 화제를 불러일으키고 있다고 한다. 전직 구글러들이 만든 검색엔진인 쿨(Cuil)이 그 주인공이다. 구글처럼 회사명과 검색엔진 이름이 서로 같은 이 쌈팍한 검색엔진은 구글과는 다른 방식으로 구글보다 더 빠르고 정확하게 사용자들이 원하는 정보를 찾아서 내놓는다고 한다.
일단 쿨의 창업자들은 대부분 검색엔진에 일가견이 있는 인물들로 모였다고 한다. 앤나 패터슨, 러셀 파워는 구글의 검색서버인 테라구글 개발자로 참여했으며, 톰 코스텔로는 IBM의 검색엔진인 웹파운틴을 개발에 참여한 바 있다(via 조선일보). 즉, 이전에 구글 검색엔진 제작에 참여했던 사람들과 다른 검색엔진을 만들었던 사람들이 자신들의 경험과 실력을 살려서 구글을 이길 수 있는 검색엔진을 만든거 같다.

검색랭킹 방식도 기존 검색엔진과는 다르다고 한다. 기존 검색엔진은 링크 분석이나 트래픽 랭킹 방식을 취하고 있다. 구글의 페이지랭크 역시 얼마나 많은 링크를 참조하느냐, 혹은 역참조하느냐로 랭킹을 정한다. 그런데 쿨은 웹페이지의 내용을 분석해서 그것을 랭킹에 반영한다고 한다. 또한 비슷한 검색결과를 그룹화 시켜서 주제별로 보여주거나 더 검색할 수 있게 한다. 즉, 검색결과 한쪽에 카테고리에 의한 분류를 둬서 카테고리별로 검색결과를 탭드롭다운형식(맞는 표현일지 모르지만)으로 모아서 보여준다. 또한 탭 형식으로 비슷한 검색결과를 또 모아서 보여주기 때문에 검색결과 선택의 폭이 상당히 넓어졌다.

쿨의 첫 화면을 보면 구글처럼 썰렁하기 그지없다. 다만 구글과 달리 검은색 배경화면과 Search 121,617,892,992 web pages라는 문구가 구글과는 뭔가 다르다는 것을 보여준다. 구글이 최근 1조개의 링크를 인덱싱했다고(그 중에 4%는 허수지만) 말했는데 쿨은 그에는 못미치는 1200억개의 링크를 인덱싱하고 있다. 구글이야 그동안 수집한 데이터의 양이 워낙 많고 데이터 센터의 규모도 상상을 초월한다지만 이 신생 검색엔진인 쿨은 그래도 다른 검색엔진의 3배의 규모를 자랑한다. 또한 사용자의 사생활 보호 차원에서 사용이력 등은 저장하지 않는다고 한다.
일단 쿨은 다른 검색엔진에 비해 3배의 검색능력을 보여준다고 한다. 아마도 그 대상은 구글이 될 것이다. 또한 기존의 링크분석이나 트래픽 분석이 아닌 실제 그 내용을 분석하기 때문에 기존 검색엔진과는 확연히 다른 결과를 나타낼 것이며 그 통찰력은 다른 검색엔진과는 차별이 될 것이라고 한다. 즉, 인기도가 아닌 컨텐츠 자체의 질을 보고 결과를 내놓기 때문에 다르다는 것이다.
잠깐 테스트를 해봤을 때 일단 한글검색은 아직까지 지원하지 않는듯 싶다 일부 한글 검색어는 검색이 안되는 듯 싶다. 이 블로그인 '학주니닷컴'과 쥔장인 '학주니'로 검색하면 결과가 없다고 한다. 처음에는 황당했으나 다른 단어로 검색했는데 한글로 입력하면 결과가 안나와서 아직까지 한글지원은 안되는가 싶다는 생각이 들었다. 다른 검색어(예를 들면 '인터넷'같은)들은 잘 검색이 되는데 구글도 검색되는 '학주니'라는 검색어에 대한 결과가 안나오니 소개하는 내 입장으로는 참으로 민망하기 그지없는 상황이다.
과연 쿨이 얼마만큼 영향력을 끼칠 수 있을까? 일단 미국을 대상으로만 했을때도 과연 구글에 대항할 수는 있을까? 이미 구글 검색엔진에 익숙해진 사람들이 검색엔진을 바꿀려고 할 것인가? 쉽지 않은 일이다. 점점 구글 검색엔진의 점유율은 높아져가고 있고 기존의 야후나 Live.com, AOL 등의 다른 검색엔진의 점유율은 떨어져가고 있는 상황에서 이런 신생 검색엔진이 발붙힐 틈이 있을지 궁금하다. 다만 파이넨셜 타임즈(FT)는 구글이 쿨의 등장에 꽤 신경이 쓰이고 있다는 평을 내놓았다. 구글의 인덱싱이 1조개를 넘었다는 자료를 내놓은 것은 이런 쿨의 등장이 부담스러웠기 때문이라는 평이다.
그런데 글을 쓰면서 느낀 점은 과연 내용을 분석해서 랭킹에 반영한다고 했는데 어떻게 반영할 것인가 하는 것이다. 내용의 질을 어떻게 분석할 것인가? 내용에 주제어가 많으면 좋은 글로 반영할 것인가? 아무리 기계적 알고리즘이 발달했다고 하더라고 좋은 글과 나쁜 글을 구분하는 것은 사람의 인식만은 못할텐데 말이다. 고유한 알고리즘이 있을것이고 그 부분에 대한 것은 공개를 안할테니 향후에 어떤 평가를 받는지 봐야 할 듯 싶다.
과연 전직 구글러들과 검색엔진 전문가들이 만든 색다른 방식의 검색엔진 쿨이 얼마나 바람몰이를 할 수 있을지 지켜보도록 하자.
* 관련 뉴스 *
전직 구글러들, 새로운 검색엔진 '쿨' 개발 (ZDNet Korea)
신흥 검색엔진 `쿨`, 구글에 도전장 (조선일보)
일단 쿨의 창업자들은 대부분 검색엔진에 일가견이 있는 인물들로 모였다고 한다. 앤나 패터슨, 러셀 파워는 구글의 검색서버인 테라구글 개발자로 참여했으며, 톰 코스텔로는 IBM의 검색엔진인 웹파운틴을 개발에 참여한 바 있다(via 조선일보). 즉, 이전에 구글 검색엔진 제작에 참여했던 사람들과 다른 검색엔진을 만들었던 사람들이 자신들의 경험과 실력을 살려서 구글을 이길 수 있는 검색엔진을 만든거 같다.
검색랭킹 방식도 기존 검색엔진과는 다르다고 한다. 기존 검색엔진은 링크 분석이나 트래픽 랭킹 방식을 취하고 있다. 구글의 페이지랭크 역시 얼마나 많은 링크를 참조하느냐, 혹은 역참조하느냐로 랭킹을 정한다. 그런데 쿨은 웹페이지의 내용을 분석해서 그것을 랭킹에 반영한다고 한다. 또한 비슷한 검색결과를 그룹화 시켜서 주제별로 보여주거나 더 검색할 수 있게 한다. 즉, 검색결과 한쪽에 카테고리에 의한 분류를 둬서 카테고리별로 검색결과를 탭드롭다운형식(맞는 표현일지 모르지만)으로 모아서 보여준다. 또한 탭 형식으로 비슷한 검색결과를 또 모아서 보여주기 때문에 검색결과 선택의 폭이 상당히 넓어졌다.
쿨의 첫 화면을 보면 구글처럼 썰렁하기 그지없다. 다만 구글과 달리 검은색 배경화면과 Search 121,617,892,992 web pages라는 문구가 구글과는 뭔가 다르다는 것을 보여준다. 구글이 최근 1조개의 링크를 인덱싱했다고(그 중에 4%는 허수지만) 말했는데 쿨은 그에는 못미치는 1200억개의 링크를 인덱싱하고 있다. 구글이야 그동안 수집한 데이터의 양이 워낙 많고 데이터 센터의 규모도 상상을 초월한다지만 이 신생 검색엔진인 쿨은 그래도 다른 검색엔진의 3배의 규모를 자랑한다. 또한 사용자의 사생활 보호 차원에서 사용이력 등은 저장하지 않는다고 한다.
일단 쿨은 다른 검색엔진에 비해 3배의 검색능력을 보여준다고 한다. 아마도 그 대상은 구글이 될 것이다. 또한 기존의 링크분석이나 트래픽 분석이 아닌 실제 그 내용을 분석하기 때문에 기존 검색엔진과는 확연히 다른 결과를 나타낼 것이며 그 통찰력은 다른 검색엔진과는 차별이 될 것이라고 한다. 즉, 인기도가 아닌 컨텐츠 자체의 질을 보고 결과를 내놓기 때문에 다르다는 것이다.
잠깐 테스트를 해봤을 때 일단 한글검색은 아직까지 지원하지 않는듯 싶다 일부 한글 검색어는 검색이 안되는 듯 싶다. 이 블로그인 '학주니닷컴'과 쥔장인 '학주니'로 검색하면 결과가 없다고 한다. 처음에는 황당했으나 다른 단어로 검색했는데 한글로 입력하면 결과가 안나와서 아직까지 한글지원은 안되는가 싶다는 생각이 들었다. 다른 검색어(예를 들면 '인터넷'같은)들은 잘 검색이 되는데 구글도 검색되는 '학주니'라는 검색어에 대한 결과가 안나오니 소개하는 내 입장으로는 참으로 민망하기 그지없는 상황이다.
과연 쿨이 얼마만큼 영향력을 끼칠 수 있을까? 일단 미국을 대상으로만 했을때도 과연 구글에 대항할 수는 있을까? 이미 구글 검색엔진에 익숙해진 사람들이 검색엔진을 바꿀려고 할 것인가? 쉽지 않은 일이다. 점점 구글 검색엔진의 점유율은 높아져가고 있고 기존의 야후나 Live.com, AOL 등의 다른 검색엔진의 점유율은 떨어져가고 있는 상황에서 이런 신생 검색엔진이 발붙힐 틈이 있을지 궁금하다. 다만 파이넨셜 타임즈(FT)는 구글이 쿨의 등장에 꽤 신경이 쓰이고 있다는 평을 내놓았다. 구글의 인덱싱이 1조개를 넘었다는 자료를 내놓은 것은 이런 쿨의 등장이 부담스러웠기 때문이라는 평이다.
그런데 글을 쓰면서 느낀 점은 과연 내용을 분석해서 랭킹에 반영한다고 했는데 어떻게 반영할 것인가 하는 것이다. 내용의 질을 어떻게 분석할 것인가? 내용에 주제어가 많으면 좋은 글로 반영할 것인가? 아무리 기계적 알고리즘이 발달했다고 하더라고 좋은 글과 나쁜 글을 구분하는 것은 사람의 인식만은 못할텐데 말이다. 고유한 알고리즘이 있을것이고 그 부분에 대한 것은 공개를 안할테니 향후에 어떤 평가를 받는지 봐야 할 듯 싶다.
과연 전직 구글러들과 검색엔진 전문가들이 만든 색다른 방식의 검색엔진 쿨이 얼마나 바람몰이를 할 수 있을지 지켜보도록 하자.
* 관련 뉴스 *
전직 구글러들, 새로운 검색엔진 '쿨' 개발 (ZDNet Korea)
신흥 검색엔진 `쿨`, 구글에 도전장 (조선일보)
'Other IT Topics > Google' 카테고리의 다른 글
| 구글 검색엔진, 개인 최적화로 차별성을 두기 시작하다.. (12) | 2008/07/31 |
|---|---|
| 과연 구글은 한국에서 뿌리를 내릴 수 있을까? (10) | 2008/07/29 |
| 새로운 형식의 검색엔진 쿨, 구글에 도전장을 내밀다.. (24) | 2008/07/29 |
| 집단지성을 도입하는 검색엔진, 과연 이게 미래의 검색엔진? (8) | 2008/07/23 |
| 구글, 디그(Digg)까지 접수할려고 하나... (6) | 2008/07/23 |
| Gmail의 화려한 변신. 밋밋한 UI에 스킨을 입혀보자... (14) | 2008/07/21 |



2008/07/28 18:55
학주니님 안녕하세요.
이거 써보니.. 글쎄요.. 적응이 쉽지 않더라고요 ㅋㅋㅋ
2008/07/28 18:57
결정적으로 한글검색이 안되는게 걸리네요. ^^;
2008/07/28 19:53
엥? 한글 검색 되네요...
2008/07/28 20:40
일부 단어는 안되는군요..
결정적으로 '학주니'가 안되서.. T.T
2008/07/28 22:13
검색엔진은 사용자의 습관을 무시할 수 없는 것 같아요
어느 순간 네이버에 접속하고, 별다른 생각없이 네이버를 계속 쓰고 있는걸 보면요..
그래도 다음에서 네이버로 흐름이 바꿨듯이
정말 좋은 서비스를 제공한다면 쿨로 바뀔수도 있겠죠~~
좋은 정보 감사합니다^^
2008/07/28 23:08
아직은 조금 더 지켜봐야 할 듯 합니다.
미국에서는 쓸만 하겠지만 국내에서는 좀 어려울듯.. ^^;
2008/07/29 00:45
디자인이 아주 섹시하네요. 근데 구글보다 좀 느립니다;;;
2008/07/29 09:30
구글은 워낙 빠르잖아요..
어쩌면 미국안에서만 최적화 되었을지도 모르겠습니다..
2008/07/29 08:25
사이트 배경화면이 검은색. 검색결과 나열방식이 가로배열(웬지 혼란스럽네요^^)
풍부하지 못한 데이타정보.
구글의 아성을 위협하기엔 많이 부족해 보이는 것 같아요!^^
하지만 향후 어떻게 변할지 모르니 조금 지켜 보아야 할것 같아요.
2008/07/29 09:30
시일이 지나서 좀 더 많은 데이터가 수집되어야 본격적인 평가가 이뤄질 듯 합니다. ^^;
2008/07/29 08:52
ㅎㅎ 저도 한글 검색이 된다고 썼는데.... 학주니는 검색이 안되나보네요.. ㅎㅎ
2008/07/29 09:31
저는 안되네요..
글을 쓰는 입장에서 이리도 난처할 수 가.. -.-;
2008/07/29 09:56
비밀댓글입니다
2008/07/29 12:57
저도 등록해놓겠습니다. ^^;
2008/07/29 10:24
이게 웃긴게 시스템페일이나 타임아웃이 나면 결과가 없다고 나오는 것 같습니다. 같은 검색어도 어떤때는 되고 어떤때는 안되고 검색결과에서 페이지를 옮기는 상황에서도 결과가 없다고 나옵니다.
그리고 스펨이 전혀 걸러지지 않습니다. 스펨결과가 절반 이상.
아직 갈길이 한참 남은 것 같습니다. 이분들 할일 많으시겠군요.. ^^
2008/07/29 13:01
이제 시작인데 커스터마이징할 것들이 많겠죠.. ^^;
2008/07/29 11:03
정말 흥미롭내요 페이지의 콘텐츠 내용자체를 분석하는 알고리즘이 대략 어떤지 궁금합니다.
이전에 구글의 검색랭킹 알고리즘과 관련된 논문을 분석 한적이 있는데 각각의 HTML들이 주고 받은 링크를 가지고 페이지의 신뢰도를 수치화시켜서 높은 신뢰도를 가진 페이지에 의해 인용되면 높은 포인트를 주는 식으로 계산결과를 주고받으면서 수렴하는 알고리즘이 었는데 ...
자연어인 콘텐츠 내용을 어떤식으로 계산결과가 나오게 수치화 하는걸까요 페이지 사이즈? 단어? 절? 관련 논문이 없는지 몹시궁금하내요 ;;;
2008/07/29 13:02
이 검색엔진에서 사용하는 알고리즘이 혁신적인 내용이라면 관련 논문들도 나오기 시작하겠죠..
구글의 페이지랭크는 이제는 대부분 다 알려진 내용들이니 관련 논문들도 많을 것이라 보여집니다..
2008/07/29 13:10
페이지랭크가 기존 텍스트기반의 검색엔진들의 단점을 보완하기 위함이라고 알려져있는데, 쿨은 다시 그쪽으로 돌아섰네요. 글 읽고 바로 리뷰쓰느라 사용은 못해봤지만, 그래도 기대가 되기는 합니다. 전공분야가 이 쪽이 될 것 같아서 새로운 내용이 나오는 게 반갑네요.
2008/07/29 14:19
어떤 부분이 달라져있는지 잘 모르겠습니다..
페이지랭크와는 다른 알고리즘이라고는 하지만 기존에 사용했던 알고리즘도 아닌듯 싶더라고요..
2008/07/29 14:08
해외에서 써서 그런지 구글 보다 빠른것 같던데...
"쿨"이 아직 덜 알려져서 그렇지 구글을 제대로 압박 할 것 같습니다.
2008/07/29 14:19
국내에서는 좀 느린듯 합니다. ^^;
2008/07/29 19:42
제 닉네임은 안됩니다. -_-;;
다른걸로 우회로 검색하니 다 되네요--;
2008/07/29 20:47
저만 안되는게 아니었군요.. ^^;