구글이 하루에 처리하는 데이터 용량이 얼마인지 아는가? 최근 구글 엔지니어에 의해 쓰여진 백서(white paper)에 의하면 구글은 웹을 인덱싱하고 검색 결과를 처리하고 광고를 처리하고 그 외의 나머지 일들을 하는데 20000 terabytes(TB, 20000 TB = 20 petabytes, 20PB)의 데이터를 하루에 처리한다고 한다.
이 엄청난 양의 처리능력은 야후나 MS와 같은 경쟁사에 대해 엄청난 경쟁력을 지닐 수 있는 기반이 된다. 구글은 매년 10배 이상으로 데이터 처리 능력을 향상시켜왔고 그 처리능력은 현재도 계속 향상되고 있는 진행형이라는 것이 놀라울 뿐이다.
구글은 최근 데이터센터들을 계속 세우면서 처리능력 및 보관용량을 점점 키워왔다. 그리고 구글은 HP, IBM, Sun 등의 대형 브랜드 서버 제품을 사용하지 않고 직접 서버를 제작해서 사용하는 것으로 유명하다. OS는 리눅스를 사용하며 자체적으로 커널을 커스터마이징해서 사용하는 것으로 알려졌다. 10년 가까이 운영하면서 생긴 노하우로 인해 그러한 데이터 처리능력을 자랑할 수 있는 위치에 온 것이다. 대단하다 말할 수 밖에 없다.
최근 구글 애드센스의 정책 변경으로 구글의 위상에 약간의 변화가 있는 것은 사실이지만 전 세계적으로 가장 많이 사용하고 있는 검색엔진이 아직까지 부동의 1위가 구글이라는 사실은 그만큼 구글의 데이터 처리능력이나 검색엔진으로서의 신뢰성이 타 서비스에 비해서 월등하다는 증거라 할 수 있을 것이다.
과연 국내 포탈사이트들이 하루에 20PB 정도의 데이터를 소화해낼 수 있을까? 내 생각으로는 아마 100TB도 어려울 듯 싶다. 아무리 국내 인터넷 인프라가 잘 갖춰져있더라도 처리할 수 있는 데이터는 상대적으로 적기 때문이다. 그래도 국내 포탈사이트가 구글정도까지는 아니더라도 100TB 정도는 무난하게 처리할 수 있는 날이 오기를 바랄 뿐이다.
댓글을 달아 주세요
헉! 소리가 절로 나오는 처리능력이네요.
2008/01/10 13:18구글이 어디까지나 커질지 어떻게 변화할지 상상하는 것만으로도 재미있어지겠어요.
앞으로도 처리할 데이터들이 많을테니 더 늘어가겠죠..
2008/01/10 19:42와... 대단해요...
2008/01/10 13:46근데 사실 구글의 검색이 점점 대용량처리에 있다는 느낌을 줍니다.
네이버도 다음과 비교할 때 엄청난 서버를 보유하고 있다는데...
빠른 인덱싱과 빠른 검색결과가 구글의 생명이죠.
2008/01/10 19:43그것때문에 UI도 아주 심플하게 하는데.. ^^
20페타라.....들어본적없는 순자군요....^^
2008/01/10 16:37구글이 정말 잘나가긴 잘 나가는 모양입니다.
음.. 순자는? ^^;
2008/01/10 19:4320PB는 정말로 상상을 초월한 숫자죠..
-_- 전세계의 정보를 모두 모으겠다는 Google의 야심(?)으로 본다면 당연한 것이겠지만 열심히 모으고 있군요. 아마 제 개인정보도...
2008/01/10 16:52전세계적으로 데이터들을 모으고있는 구글이니까..
2008/01/10 19:44아마도 제 개인정보가 잔뜩 있을꺼에요.. -.-;
헉...페타 단위까지 올라가면...
2008/01/10 23:2520 페타 바이트보다 20000 테라바이트가 시각적으로 필이 오는 군요....
페타바이트라는 단위 자체가 신선한(?) 단위죠.. ^^;
2008/01/11 09:07테라바이트는 이제 슬슬 익숙해지기 시작했는데 말이죠..
몇년전에는 기가바이트가 신선했는데 참 세월 빠릅니다. -.-;
페타바이트 라는 용어 자체를 오늘 처음 들어보네요.
2008/01/11 03:42역쉬~ 구글이군요. 그런데 왜 갑자기 씁쓸한 마음이 드는걸까요?
전 세계의 모든 정보를 다 끌어모아서 인덱싱할려는 구글의 음모(?) 때문이 아닐련지요? ^^
2008/01/11 09:08