이 영상에서는 구글의 web spam team 팀장으로 있는 Matt Cutts가 원본에 대한 저작권 침해 대처방안을 설명하고 있습니다.

이 영상을 통해 알 수 있는 몇 가지 흥미로운 사실은

  • 구글이 새로 생성되거나 업데이트되는 모든 웹페이지를 완벽하게 실시간으로 크롤링하지 못 한다
  • 구글이 웹마스터가 제출한 사이트맵보다는 자신들의 평가기준을 근거로 사이트 간의 크롤링 우선순위를 정한다
    (사이트맵의 경우 아예 제출되지 않거나 크롤링을 막아도 검색결과에 노출되기도 함)
  • 트위터나 페이스북 같은 대형 사이트는 매우 빈번하게 크롤링 된다

이런 사실들이 현실로 작용할 때 Matt Cutts가 받은 질문처럼 크롤링 빈도가 낮은 사이트에서 올린 원본이 빈도가 높은 사이트에서 올린 카피본보다 늦게 크롤링되서 원본의 지위가 뒤바뀌는 상황도 충분히 발생할 수 있습니다.

질문 내용 : 
사이트A는 1시간 마다 수집되고 사이트B는 하루에 한 번 수집된다. 
사이트B가 생성한 페이지(원본)를 사이트A가 카피하고 시간을 조작했다.
구글은 사이트A의 카피본을 사이트B의 원본보다 먼저 수집했다. 
이 경우 누구의 콘텐츠가 원본인가? 

Matt Cutts가 제시한 방법대로 트위터 같은 유명사이트에 새로 생성한 링크를 올림으로써 카피본보다 우선 크롤링되도록 할 수도 있습니다. 이 방법은 페이지를 홍보하는데도 효과가 있습니다.

또 다른 방법은 아래 게시글에서 상세하게 설명하고 있는 구글의 ‘fetch as google’ 기능을 활용하는 것입니다.

http://searchenginewatch.com/sew/how-to/2326164/index-your-content-faster-with-the-fetch-as-google-tool

fetch as google은 웹페이지가 기기 별로 구글에 수집, 렌더링 되는 상황을 직접 확인하고 분석할 수 있도록 해줍니다. 그러면서 새로 생성되거나 업데이트된 내용이 빠르게 반영되도록 하는 기능도 합니다.
구글 fetch as google-색인요청

‘가져오기’나 ‘가져오기 및 렌더링’ 실행 후 보여지는 ‘색인에 제출’버튼을 클릭해서 구글에 직접 색인요청을 할수 있습니다.

특별한 이유 없이 검색결과에 노출이 안 되거나 빠른 검색반영이 필요할 때, 업데이트 사실을 반영하고자 할 때 ‘fetch as google’의 색인제출 기능을 활용하시기 바랍니다.

 

퍼가실 때는 출처를 꼭 밝혀주세요

글 주소 : http://www.marketology.co.kr/?p=643