외규장각 도서 환수 모금 캠페인

보통 우리는 검색엔진을 통해서 얻은 정보를 얼마나 신뢰하고 있을까? 많은 사람들이 무언가에 대해서 궁금할 때 인터넷을 통해서 찾아보라고 말을 많이 한다. 국내에서는 네이버나 다음과 같은 포탈사이트릍 통해서 검색을 하고 해외의 경우에는 구글을 통해서 검색을 하곤 한다. 그리고 우리는 대부분 검색결과에서 얻은 정보를 100% 다 믿곤 한다. 그리고 인터넷에서 얻은 정보를 다른 사람들에게 얘기하면서 인터넷 검색결과 이렇게 나왔더라 하면서 말한다. 그 말은 곧 여러 사람들에게 바이러스가 전파되듯 엄청난 속도로 퍼지게 된다.

일단 우리는 검색을 통해서 나온 결과를 거의 100% 신뢰한다는 것을 알 수 있다. 물론 심정적으로는 100% 다 신뢰해서는 안된다고 알고는 있지만 따로 검증할 방법이 많지 않기 때문에 대부분은 그대로 믿는 편이라고 본다. 그렇다면 그러한 검색엔진을 만드는 사람들은 과연 자신들의 검색엔진에 대한 신뢰도가 얼마라고 생각할까?

구글의 부사장인 마리아 메이어는 구글 검색엔진의 90%는 검증된 결과라고 말하고 있다. 즉, 90%의 신뢰도를 증명한다는 얘기다. 문제가 되는 것은 10%정도라고 할 수 있다. 아마 다른 검색엔진에 비해 신뢰성은 상당히 높은 것으로 보인다. 국내의 네이버나 다음 등에서 검색한 결과의 신뢰성이 얼마나 되는지는 모르겠지만(아마 담당자들은 100%에 가까울 것이라고 말할테니) 그냥 내 주관적인 판단으로는 높아봐야 70%, 어쩌면 50~60%밖에 안될지도 모른다는 생각을 해본다. 구글 역시 내 주관적인 판단으로는 90%는 아니고 80%정도라고 본다. 이는 국내 포탈사이트들이 이슈에 강하고 실시간으로 검색결과를 보여주는 알고리즘으로 인해 오랫동안 검증된 자료를 보여주는 구글에 비해 상대적으로 신뢰도가 떨어질 수 밖에 없는 약점을 지니고 있다고 생각하기 때문이다. 뭐 어찌되었던 국내 네티즌들은 60~70%의 신뢰도를 지닌 포탈사이트의 검색결과를 액면 그대로 믿는 경우가 많다는 것이 내가 그동안 인터넷을 바라보면서 느꼈던 점이다.

검색엔진의 가장 중요한 부분은 다름아닌 신뢰도라 본다. 신뢰도가 확보되지 않는 검색엔진 결과는 잘못된 정보, 거짓 정보를 내보내는 것이기 때문에 무용지물이며 오히려 독이 될 수도 있다는 것이다. 구글이 90%의 신뢰도를 제공한다고 하더라도 10%의 잘못된 정보가 90%의 정확한 정보 가운데 섞여있기 때문에 사용자들은 나와있는 검색결과중에서 어떤 것이 잘못된 정보인지 판단할 수 있는 능력이 전무하다. 즉, 사용자들은 일단 검색결과가 나오면 그 결과중에서 선택을 하게 되는데 모두 100% 진실이라고 생각하고 선택하기 때문에 만약 90%에 속하는 정확한 링크를 눌렀으면 모를까 10%의 잘못된 정보 링크를 눌렀을 때 사용자가 받는 데미지는 10%의 충격이 아닌 100%의 충격으로 다가올 수 있다는 것이다. 그렇게 되면 그 사용자에 한해서 해당 검색엔진은 잘못된 정보를 던져주는 신뢰도 0%의 검색엔진으로 각인이 되는 것이며 그렇게 점점 사용자들의 인식이 나빠지면 그 검색엔진은 시장에서 퇴출당할 수 밖에 없는 것이다.

결국 중요한 것은 구글이 자신들은 90%의 신뢰성을 자랑한다고 말하는 것도 좋지만 100%을 향해 더욱 노력하고 있다고 말하는 것이 더 중요하다는 것을 인식시켜줘야 한다는 것이다. 실제로 99%의 신뢰성을 자랑하는 검색엔진에서 재수없게 1%의 잘못된 링크를 건드려서 거짓정보가 확산된다던지 멀웨어 등으로 PC가 망가졌다든지 하는 경우가 생긴다면 검색엔진으로서는 매우 심각한 도덕적 치명타를 맞게 되는 것이다. 그래서 계속 신뢰도 100%를 위해 계속 알고리즘을 개발하고 갱신하고 멀웨어나 스파이웨어, 검색엔진을 통한 해킹 방지를 위해 패치하고 노력해야 하는 것이 검색엔진이 해야 할 일이 아닐까 싶다. 구글의 마리사 메이어는 자신들의 검색엔진이 타사 검색엔진보다 더 높은 신뢰를 받을 수 있다는 의미로 저런 얘기를 했겠지만 오히려 그것이 10%의 위험부담을 갖고있다는 의미로 다가올 수 있겠다는 생각이 들어서 말이다.

즉, 검색엔진에서 작은 실수라도 그것을 당한 사람에게는 매우 치명적인 결과를 보게 되므로 검색엔진에서의 작은 실수는 곧 독이 될 수 있음을 알고 계속 검색엔진의 신뢰성 확보를 위해 노력해야 할 것이다. 그것은 구글 뿐만 아니라 네이버나 다음과 같은 포탈사이트에서도 같이 적용될 문제이기도 하고 말이다. 네이버의 지식iN이 이미 쓰레기 정보로 넘쳐흐르고 있다는 평으로 인해 네이버 전체의 신뢰성이 떨어지고 있다는 것 부터가 문제라는 얘기다.

ps) 예전에 썼던 글인데 다시 읽어보니 내용의 연결이 매끄럽지 못해 다시 재작성해본다.
이 블로그에서는 나눔글꼴을 사용하고 있습니다. 제대로 즐기실려면 글꼴을 설치해서 보세요. ^^

댓글을 달아 주세요

  1. BlogIcon 아크몬드  수정/삭제  댓글쓰기

    검색엔진 제작이 얼마나 정밀한 작업을 요구하는지 새삼 느낍니다.

    2008/09/12 12:03
    • BlogIcon 학주니  수정/삭제

      정밀해야 하고 정확해야 하고 신속해야 하고..
      정말로 검색엔진에 요구사항들이 넘 많다는 생각도 해봅니다 ^^

      2008/09/12 12:56

TechCrunch에서 재미난 동영상이 올라와서 소개해본다. 일전에 Digg 스타일의 추천방식을 적용한 구글 검색엔진에 대한 이야기를 썼다. 그리고 오늘은 구글이 Digg를 인수할려고 준비중이지 않을까 하는 이야기도 써봤다. 즉, 구글은 향후에 검색엔진이 어떤 기계적인 분류 및 순위를 매기는 것과 동시에 집단지성을 이용하여 기계적인 알고리즘으로는 부족한 부분을 채울려고 하려는것 같다. 아무리 정교한 알고리즘을 적용한다고 해도 분명 구멍은 있기 마련이니 그 부분을 집단지성으로 보충하자는 의미다.


동영상의 내용은 예전에 소개했던 구글의 새로운 인터페이스다. 구글 검색엔진을 통해서 뭔가를 검색했을 때 그 결과에 Digg 스타일의 추천버튼 및 삭제버튼을 두고 또 댓글을 달게 해서 그 사이트에 대한 반응을 보고 선택할 수 있게 한다는 것이다. 추천이 많은 링크는 그만큼 검색결과 상위에 놓이게 될 것이다. 또한 삭제가 적용된 링크는 다음 검색때는 나타나지 않을 것이다. 아마도 삭제가 자주되는 링크는 다른 사람이 검색할 때도 영향을 미치게 되어 검색순위 하위에 놓이는 등 불이익을 받게 되지 않을까 싶다. 또한 개인 프로파일을 둬서 그 사람에 맞는 검색 스타일 및 댓글 등을 저장하고 공유할 수 있도록 해서 개인화에 더 신경을 쓰겠다는 내용이 담겨있다.

이제 검색엔진도 웹2.0의 집단지성을 적용하겠다는 의미며 TechCrunch는 이게 미래의 검색엔진의 모습이 아닐까 하는 질문을 던졌다. 일단 구글에 한해 이런 부분이 적용되고 있기는 하지만 구글이 현재 전 세계적으로 60% 이상을 차지하고 있기 때문에 구글이 변하면 다른 검색엔진들도 연쇄적으로 변하지 않겠느냐라는 의미로 받아들일 수 있다. 국내에서 네이버가 변하면 다음을 비롯한 엠파스, 네이트, 파란, 야후 등의 포탈들이 변하는 것처럼 말이다.

과연 검색엔진에 집단지성을 적용한 결과는 어떻게 될까? 과연 이러한 집단지성을 이용한 검색엔진이 검색의 미래가 될 수 있을까? 구글의 이러한 시도는 참신하면서도 구글의 실험정신을 옅볼 수 있는 계기가 되고 있어서 참으로 부럽다는 생각을 해본다.

* 관련 글 *
Is This The Future Of Search? (TechCrunch)
2008/07/16 - [IT Story/웹 2.0 및 서비스] - 구글, 디그 스타일의 추천방식을 도입할려고 하나?
2008/07/23 - [IT Story/웹 2.0 및 서비스] - 구글, 디그(Digg)까지 접수할려고 하나...

이 블로그에서는 나눔글꼴을 사용하고 있습니다. 제대로 즐기실려면 글꼴을 설치해서 보세요. ^^

댓글을 달아 주세요

  1. BlogIcon 프로리  수정/삭제  댓글쓰기

    음 상당히 무서운 검색엔진이라는 인상이 파아아악~드는건 왜일까요 ㅠ

    2008/07/24 11:53
    • BlogIcon 학주니  수정/삭제

      구글의 미래를 대비한 준비성이 그만큼 치밀하다는 얘기가 아닐지..

      2008/07/24 13:17
  2. BlogIcon 우주멸망  수정/삭제  댓글쓰기

    집단지성하니..
    http://www.etnews.co.kr/news/detail.html?id=200807230231
    이게 떠오르네요.

    2008/07/24 13:30
  3. BlogIcon 메아리  수정/삭제  댓글쓰기

    안녕하세요~학주님^^ 좋은 글 잘 챙겨서 읽고 있습니다~~~
    웹2.0에서는 집단지성이 강력한 힘을 발휘하는 것 같습니다.
    위키디피아의 성공처럼 사용자에 대한 완전한 신뢰가 실현되는
    검색엔진도 성공할 수 있을지 지켜봐야겠네요.

    2008/07/24 15:35
    • BlogIcon 학주니  수정/삭제

      새로운 시도일수도 있겠구요. 또한 악용될 소지도 있는 시도일 수 있겠네요.. ^^;

      2008/07/24 15:46

사용자 삽입 이미지
OpenDNS라는 서비스가 있다. 이 서비스의 개요는 간단하다. 보통 인터넷 서비스를 할려면 도메인이 필요하고 이러한 도메인을 관리할 네임서버가 필요하다. 즉, 이 도메인은 이 IP에 연결이 되어있다는 정보를 관리할 서버가 필요하다는 얘기다. 도메인 네임서버(Domain Name System)라 불리며 줄여서 DNS라 한다.

보통 집에서 인터넷을 하게 되면 자동으로 IP를 잡고 DNS도 자동으로 설정한다. 그러면 인터넷 제공업체에서 운영하는 네임서버나 아니면 KT나 하나로 등에서 제공하는 네임서버를 이용하게 된다. 168.126.63.1 이라는 IP는 많이 익숙한 IP일 것이다. 바로 코넷에서 제공하는 DNS IP다. 많이 이용하는데 이러한 DNS를 무료로 제공하는 서비스가 바로 OpenDNS다. 뭐 어지간한 DNS는 대부분 무료기는 하지만 말이다.

이런 OpenDNS에서 2006년 중반에 웹 서핑을 빠르게 하는 툴과 멀웨어 및 피싱 사이트에서 보호하는 툴을 무료로 제공하기 시작했다. 50개의 카테고리에 웹사이트들을 분류해넣고 필터링 레벨에 따라서 제공한 웹사이트의 레벨을 분류해서 보여준다. 이 과정에서 멀웨어 사이트와 피싱 사이트가 필터링되어 떨어지게 된다. 사용자는 검색결과에서 선택한 사이트가 OpenDNS에 의해 BAD 사이트로 판명이 난 경우에 검색결과와 광고등을 매칭시켜 다른 웹사이트로 다시 연결해준다. 사용자들은 화이트 리스트와 블랙 리스트를 구분해서 들어갈 수 있게 된 것이다.

이 서비스는 현재 매일 70억개의 DNS 쿼리를 조사하며 200만개의 검색결과 페이지를 제공한다. 여기서 OpenDNS는 하루에 약 2만달러의 수익을 얻는다고 한다. 그리고 현재 야후에서 독점적으로 이 서비스를 제공하고 있다(즉, 야후와 제휴를 맺어 야후의 검색결과에 OpenDNS의 멀웨어 및 피싱 사이트 필터링을 제공하고 있다는 얘기).

또한 OpenDNS는 이런 핵심기술을 무료로 제공하고 있다. 실제로 이런 필터링서비스를 구현하기 위해서는 수많은 돈이 소요되는데 OpenDNS를 이용하면 꽁짜로 수준높은 스팸 필터링 서비스를 제공받을 수 있다는 얘기다.

재밌는 것은 OpenDNS에서는 그들의 커뮤니티에서 멀웨어 사이트에 대한 어떤 순위를 매겨서 어느 레벨에서 멀웨어 필터링을 적용할지 결정한다고 한다. Digg와 비슷한 방식으로 말이다. 그리고 어떤 사용자에 의해 블랙리스트가 공개되면 다른 사용자들은 과연 이 블랙리스트가 옳은 것인지 투표를 하게 되고 투표에서 통과가 되면 새로이 OpenDNS에 블랙리스트로 등록이 되는 어찌보면 사용자에 의한 관리를 하고 있다고 한다. 블랙리스트를 집단지성의 힘으로 관리하고 있다는 얘기다.

과연 위에서 언급한 코넷에서 제공하는 DNS나 아니면 하나로, KT, 또는 다른 DNS에서 저런 필터링 및 웹서핑 속도향상 서비스를 지원하고 있을까? OpenDNS에 매력이 끌리는 이유는 바로 그런 이유 때문이 아닐까 싶다. 내가 원하지 않는 사이트에 접속하는 것을 막아주는 그러한 기능. 또 웹사이트에 좀 더 빨리 접속할 수 있는 그러한 기능때문에 말이다. 국내에서 제공하는 DNS도 저런 기능들이 빨리 추가되었으면 좋겠다는 생각이 든다.

ps) DNS가 Domain Name System의 약자라고 하더라. 그래서 수정. ㅋㅋ

* 관련 글 *
OpenDNS Makes $20k/day Filtering Phishing And Porn Sites (TechCrunch)
이 블로그에서는 나눔글꼴을 사용하고 있습니다. 제대로 즐기실려면 글꼴을 설치해서 보세요. ^^

댓글을 달아 주세요

  1. :)  수정/삭제  댓글쓰기

    음 저도 오픈디엔에스를 사용한지 한 1년정도 되었는데요, 사실 그 효과가 무엇인지, 원리가 무엇인지 그런거는 전혀 몰랐습니다. 예전에 우연히 어떤 포스팅을 보고 막연히 좋겠다 싶어 사용했었거든요. 얼마전에 포맷후 깜빡하고 오픈디엔에스를 적어주지 않고 인터넷을 사용했는데, 어떤 곳은 자꾸 못들어가고, 들어가는데 하루종일 걸리고 그러더군요...어떤 싸이트들은 무슨 차단 메세지였는데...국가에서 유해사이트로 분류하여 뭐 차단했네 어쩌네 하면서 말이죠...
    혹시 오픈디엔에스를 안 넣어줬더니 그거 때문에 그런가...생각이 번뜩 나서 넣어주니 언제 그랬냐는듯이 아주 잘 되더군요. 저같은 사람들에겐 아주 고마운(?) 존재입니다.^^

    2008/07/21 21:16
    • BlogIcon 학주니  수정/삭제

      수많은 DNS를 보유하고 있어서 그런지도 모르겠습니다. ^^;

      2008/07/22 10:23
  2. BlogIcon 랜덤여신  수정/삭제  댓글쓰기

    늘 OpenDNS를 사용하면서 수입원이 무엇인지 참 궁금했습니다. OpenDNS는 주소창에 키워드를 입력하면 자체 검색 페이지가 뜨는데, 여기에 광고가 달려 있어서 그 수익으로 먹고 사나 싶었거든요. 역시 그랬군요.

    2만 달러라. 크다고도, 작다고도 말할 수 있는 돈이네요.

    2008/07/22 04:00
    • BlogIcon 학주니  수정/삭제

      사이트의 규모가 어느정도인지는 모르겠지만 매일 $20000이면 한달이면 $600000이고 적은 돈은 아니겠죠? ^^;

      2008/07/22 10:24
  3. BlogIcon 구차니  수정/삭제  댓글쓰기

    간혹 헷갈리는게 DNS의 S가 server인지 service인지 간혹 멀 써야 할지 헷갈리더라구요.
    하루 2만 달러면.. 대략 2000만인가요? 한달이면 6억 OTL
    제가 보기에는 어마어마한 규모 같은걸요 ㅎ

    2008/07/22 11:11
  4. BlogIcon 이드,,,  수정/삭제  댓글쓰기

    제 블로그에 이 서비스 소개를 했었고 저도 유용하게 사용하고 있는 곳이지만 항상 궁금했던게 어떻게 수익을 얻어 서비스를 계속 제공을 하는 것일까 였는데 이번에 자세히 알게 되었네요 수익이 꽤나 짭짤하군요 ㅋ

    2008/07/22 19:35
    • BlogIcon 학주니  수정/삭제

      뭐 잘나가는 서비스는 그 나름대로의 수익모델을 갖고 있겠지요. ^^;

      2008/07/22 19:54





카테고리

학주니의 생각 (989)
IT Topics (846)
Current Topics (96)
Personal Story (34)
Picture (11)
  • 1,293,459
  • 1,15111,495
Tatter & Media Tistory get rss
위자드닷컴 추천블로그 | 학주니닷컴

학주니닷컴

학주니's Blog is powered by Tattertools / Supported by Tatter & Media
Copyright by 학주니 [ http://www.ringblog.com ]. All rights reserved.

Tattertools Tatter & Media DesignMyself!
학주니's Blog is powered by Textcube. Designed by Qwer999. Supported by Tatter & Media.