구글 패널티 – 인덱스 삭제

모르고 있었는데 11개 사이트가 구글의 SERP에서 완전히 삭제되었다. SERP에서 완전히 삭제되었다는 건 구글의 캐쉬를 포함한 구글의 모든 검색 결과에서 완전히 삭제되었다는 얘기로 site:domain으로 검색을 실행해서 아무런 결과가 없는 것을 말한다. 소위 얘기하는 가장 강력한 처벌로써(the most extreme kind of penalty) 구글 검색에서는 존재하지 않는 사이트나 마찬가지가 되었다는 얘기다.

신경을 끄고 있어서 전혀 모르고 있었는데(구글 이외의 다른 검색을 통해서 들어오는 트래픽이 더 많기에…) 지난 12월 10일 무렵 대대적인 SERP 업데이트가 있었나보다. 정확히는 모르겠지만 그 무렵에 삭제가 된 것 같다. (아주 멋진 크리스마스 선물을 구글로부터 받은 셈…)사실 중요한 건 언제가 아니라 어떻게이다. 내가 궁금한 건 이게 구글의 알고리즘에 의해서 자동으로 이루어진 일인지 아니면 인간에 의해서 인위적으로 이루어진 일이냐이다. 아무래도 수동인 것 같다…

다시 창과 방패의 치열한 전쟁터로 돌아가야겠다.
방심하는 사이에 방패에게 한 방 먹었다…

구글 검색엔진이 해킹툴? 천만의 말씀!

구글 검색엔진이 해킹툴?이라는 제목의 세계 최대 검색서비스 구글이 해커들의 천국이라는 오명을 쓰게 됐다는 기사가 있다.

구글의 강력한 검색 알고리듬을 이용해 대학 학내망에 침입 한 후 학생들이 올려놓은 음악파일이나 비디오게임을 무단으로 퍼나를 수 있다는 소문이 네티즌들 사이에 급속히 퍼졌다는 것이다.

또한 이 기사는 EU의 저작권 시비로 가뜩이나 심기가 불편한 구글의 뒷통수를 때린 이 해킹사건의 장본인인 지미 루스카라는 이름의 21살 미국 청년이라고 소개하면서 그가 해킹 방법을 소개한 동영상을 구글 소유의 UCC사이트 유튜브에 올림으로써 구글을 한층 당혹스럽게 만들고 있다고 한다. 이에 대해서 구글의 검색결과 품질 관리를 담당하는 매트 커츠 구글 엔지니어는 저작권 문제를 고려해 오래전부터 MP3음악파일을 검색하는 기능을 제한해 왔기 때문에 루스카의 방법은 음악파일이 담긴 웹페이지를 검색해 줄 뿐 음악파일에 접근할 수는 없다며 평가절하했다고 한다.

이에 대해서 파이낸셜타임스는 프랑스 경제지 레제코를 인용, 루스카가 만든 방법대로 일부 웹사이트를 해킹한 결과, 음악 파일을 단시간 내 복제할 수 있었다고 10일 보도했으며 MP3파일 뿐 아니라 애플이 사용하는 MP4파일과 영화, TV프로그램, 비디오 게임까지 열어볼 수 있었고 구글이 아닌 야후나 엑사리드 등 다른 검색엔진을 이용할 경우에도 성공률은 낮아졌지만 마찬가지로 불법복제/span가 가능하다고 했단다.

지난해 이미 검색엔진을 이용한 음악파일 불법복제 가능성에 대해 경고한 바 있는 국제축음산업연합(IFPI)은 이번 사건에 대해 “필요하다면 법적조치도 불사하겠다”며 강경한 입장을 보이고 있다고 한다.

이 기사는 구글 검색엔진을 이용한 해킹 소식에 네티즌들은 열광했다고 보도했으며 지난 4월 유튜브에 게시된 동영상은 지금까지 43만명 이상이 조회했으며 가장 즐겨찾는 파일에 선정됐다고 한다.

그런데 나는 도대체 누가 어디를 어떻게 해킹을 당했고 구글이 정말 당혹해 했는지 궁금하다.

검색엔진이라는 게 해킹툴도 전혀 아니고 루스카가 사용하는 방법은 이미 구글에서 공개한 방법이다. http://www.google.com/intl/en/help/operators.html

검색기능사를 양성하는 나라에서 이 정도 상식이 해킹으로 간주되는게 이해가 안된다.

생각해 보시라. 목욕하는 내 모습을 보여주기 싫다면 담장을 높이고, 현관문을 달고, 욕실 창문에 커튼을 쳐야한다. 낮은 담장에 문이나 커튼이 훤히 열어놓고 목욕을 한다면 지나가는 누구라도 볼 수 있다는 사실을…

불법 다운로드? 웹에 게시하는 목적 자체가 사용자나 방문자로 하여금 다운로드 받게 하기 위함이다. 평범한 사이트의 모든 이미지나 사진도 브라우저의 캐시폴더에 다운되고 있다. 다시 말하지만 이것은 절대 해킹이 아니다.

아는 사람은 알겠지만 이게 다 네이버와 다음에 의한 무지한 네티즌들이 대량으로 양성되었기 때문인 것 같다. 검색엔진도 아닌 주제에 검색엔진의 탈을 뒤집어 쓰고서는 상대적인 열등함을 숨기기에 급급한 그들이 진정한 검색엔진인 구글이 이런 말도 안되는 기사로 해킹툴이란 오명을 뒤집어 쓸 때마다 안도의 한숨을 쉬고 있다는 걸…

아래와 같은 몇개의 간단한 방법으로 사이트의 특정 디렉토리나 파일이 검색엔진에 노출되지 않게 할 수 있다. 아래와 같이 간단하고 기본적인 내용이 이해가 안 간다면 사이트를 직접 운영하지 말아야 할 것이다. 사이트 운영자나 서버 관리자가 무슨 소린지 모른다면 해고하는 게 상책이다.

  1. 파일을 웹에 올리지 않는다.
  2. 파일이나 폴더(디렉토리)에 링크를 걸지 않는다. 링크를 거는 것은 따라 들어오라고 초대하는 것과 같고, 검색엔진이나 일반 방문자가 그 링크를 따라 들어가지 말아야 할 이유가 전혀 없다. 이것은 절대로 해킹이 아니다.
  3. Robot Exclusion 프로토콜을 사용한다.
    • META NAME=ROBOTS CONTENT=NOINDEX
    • META NAME=ROBOTS CONTENT=NOFOLLOW
    • META NAME=GOOGLEBOT CONTENT=NOARCHIVE
    • META NAME=GOOGLEBOT CONTENT=NOSNIPPET
  4. 보안이 요구되는 디렉토리에는 인증을 받아야 들어갈 수 있도록 한다.




Google 애드센스 세미나 초대

애드센스 팀으로부터 이메일이 도착했다. 서슬이 시퍼래서 냉정하게 계정을 박탈하기로 유명한 ‘팀’이라, 받은 메일 리스트에서 ‘Google 애드센스 팀’이라는 발신인을 보았을 때는 순간 뜨끔했으나, ‘Google 애드센스 세미나에 귀하를 초대합니다’라는 메일 제목을 보는 순간 안도의 한숨을 내쉬었다.

다음 주 화요일(6월 19일) 저녁에 스타타워에 위치한 Google 사무실로 초대한다는 내용이다. 간단한 스낵도 제공하는 것 같다. 스케쥴을 뒤져보니 그 날은 동서들과 선약이 있다. 뭐, 선약이 없어도 선뜻 가게될 것 같지는 않다. 구글 사무실이 궁금하기는 하지만, 글쎄… 대체 뭐하는 인간들이 초대받고 올까…?

자꾸 궁금해지기 시작한다. 참아야 하느니라…