미 유명 블로거들「제발 내 글 좀 훔쳐가지 마」

일반입력 :2007/08/07 10:10

Elinor Mills

로렐 반포센은 매우 열정적인 저자이자 여행 작가이면서 자연 사진을 전문으로 찍는 사진사이기도 하다.

그는 상당히 인지도 있는 블로그를 운영하고 있는데 재미있는 사실은 그가 운영하는 블로그의 주제가 바로 블로깅에 대한 것이라는 점이다. 최근 그의 최대 관심사는 온라인 표절, 복제 문제이다. 매일 같이 자신의 저작물을 무단 복제하는 사람들에게 분노하고 있기 때문이다.

반포센은 온라인 무단 표절 문제는 최근 내가 가장 관심 있는 분야라고 말했다.

그는 이어 나는 글을 써서 생계를 이어가는 사람인데, 저작권법에 무지하거나 아니면 단순히 인터넷에 올라와 있는 글이라고 해서 무조건 공짜라고 생각하는 사람들이 내 작품을 마음대로 복사해 갈 때마다 정말 화가 난다며 내게는 내 작품을 훔쳐가는 것과 마찬가지이기 때문이다라고 토로했다.

반포센은 이러한 저작권 침해가 게으른 대학생들이 보고서를 쓰기 위해 다른 논문이나 책의 일부를 베끼는 행위와 동일한 수준의 일처럼 치부되어서는 안 된다고 주장했다. 온라인에 활개치고 있는 무단 복제 전문가들은 한 시간에 수천 개의 블로그 게시물들을 복사해 올 수 있고, 이를 이용해 맥락 광고를 유치해 부정한 수익을 올리고 있기 때문이다.

이러한 류의 웹사이트를 웹 퍼블리셔들은 소위 스크래퍼 사이트라고 부른다. RSS기능을 이용, 게시물의 무분별한 스크랩을 하는 것이 특징이기 때문이다.

반포센의 '로렐 온 워드프레스(Lorelle on WordPress)' 블로그는 블로깅을 할 때 해야 할 것과 하지 말아야 할 것을 정리해 놓은 곳이다. 블로그 활동 중 하지 말아야 할 것 중 하나가 바로 허락 없이 타 사이트의 저작물을 스크랩 해오는 것.

반포센은 자신의 저작물이 무단 스크랩된 적이 있는지, 또 어디로 스크랩이 되었는지 알아볼 수 있는 몇 가지 방법을 적극 활용하고 있다.

우선 그는 자신이 제작한 모든 글들에 링크를 걸어놓아 만약 그의 글이 스크랩되어 다른 사이트에 게재되었을 경우, 즉각 그 정보를 다시 트랙백(Trackback)할 수 있게 만들었다. 트랙백은 웹 퍼블리셔들이 그들의 저작물들을 누가 가지고 갔는지 더욱 쉽게 알 수 있도록 만든 링크백 방법 중 하나이다.

그는 또한 구글 얼러트(Google Alerts) 기능을 이용, 구글이 뉴스 사이트나 블로그에서 그의 저작물을 발견할 경우 즉시 자신에게 알려 주도록 조치해 놓았다.

이와 더불어 구글 키워드 검색을 통해 구글 검색, 구글 블로그 검색, 그리고 테크노라티(Technorati) 등에서 자신의 이름을 주기적으로 검색해 보고 있고, 이러한 검색들이 통하지 않을 경우를 대비, 워드프레스(WordPress) 플러그인을 활용해 연관관계 없는 여러 단어들로 구성된 디지털 지문을 자신의 글에 삽입하고 있다.

이러한 노력들 덕분에 반포센은 타 사이트에 무단 게재된 자신의 글을 대부분 찾는 편이다.

만약 해당 사이트가 처음으로 그의 저작물을 무단 게재하였을 경우, 그는 이메일을 통해 허락 없이 무단으로 자신의 글을 게재하지 말 것을 부탁한다.

만약 이제 대한 답을 받지 못하거나 이전에 그와 한 번 부딪혔던 사이트가 또 다시 이런 일을 저지를 경우, 정지 명령이 첨부된 메일을 통해 그는 그들이 자신의 저작권을 침해하고 있으며 자신의 저작물을 삭제하지 않을 경우 디지털 밀레니엄 저작권법(DCMA)에 의거, 법적인 조치를 취할 것이라고 경고한다.

반포센은 이에 그치지 않고 웹사이트를 운영하는 회사와 해당 사이트 및 검색 엔진의 광고주들에게 메일이나 팩스를 통해 충분한 증거를 제시하며 DCMA는 광고주, 웹 운영자, 그리고 검색엔진 등에도 저작권 침해에 대한 책임을 물을 수 있도록 하고 있다는 사실을 주지시킨다고 밝혔다.

난 이러한 경우를 대비에 각종 관련 문서 서식들을 만들어 이용하고 있다고 그는 덧붙였다.

지난해 12월 풋노티드(Footnoted.org) 편집장 미셸 레더는 그의 글을 지속적으로 무단 복사, 게재해 오던 한 사이트를 상대로 저작물 사용 정지 명령을 내렸다. 그는 내가 그들의 저작물 무단게재를 비난하기 위해 쓴 글조차 그 사이트는 스크랩 해 갔다라고 웃으며 말했다.

이건 단순히 돈의 문제가 아니다라고 레더는 덧붙였다. 다른 사람의 사업 모델이 나의 저작물을 훔침으로써 수익을 창출하는 것이라면, 그건 매우 심각한 문제라는 것이다.

최근 자신의 저작물이 어디로 스크랩되어 갔는지 무료로 알아볼 수 있는 온라인 서비스가 등장했는데, 카피스페이스(CopySpace)가 바로 그것이다. 현재 웹 사이트 운영자 20만명 정도가 이 무료 서비스를 이용하고 있고, 수천명 정도는 이보다 더 수준 높은 서비스를 유료로 이용하고 있다고 이 서비스를 제공하는 인디고 스트림 테크놀로지스(Indigo Stream Technologies) CTO 기데온 그린스펀은 설명했다.

다양한 소스에서 여러 정보들을 한 데 취합하는 개념의 사이트도 존재한다. 이들 대부분은 특정 주제에 관한 사이트인 경우가 많은데, 대표적으로 부동산이나 자동차 관련 정보 사이트들을 들 수 있다.

이들 또한 맥락광고(contextual ads)를 적극 활용하는 편이다. 이들 중 몇몇은 블로그나 기타 사이트(CNET News.com도 여기에 종종 포함된다)에서 글 전체를 토씨 하나 틀리지 않고 올리는 경우도 있지만, 또 많은 수의 사이트들은 해당 글의 일부분, 즉 한 문단이나 두세 문단 정도만 게재해 놓은 후 본 페이지의 링크를 아래 표시하는 방식을 선호한다.

하지만 저작물의 원본 위치에 대한 링크를 제공한다고 해서 저작권법 위반 혐의를 피해갈 수는 없다고 관련 전문가들은 말했다.

대부분의 스크래퍼 사이트 운영자들은 자신의 신원을 잘 밝히지 않는다. 그러나 현재 '그레이울프의 SEO 블로그'를 운영하는 SEO 컨설턴트 마이클 그레이는 작년 한 때 활약했던 자신의 웹 스크래퍼 생활에 대해 털어놓았다.

현재 나는 손을 뗀 상태이다. 그만한 시간과 노력을 들일만한 가치가 없는 일이었다고 그는 최근 인터뷰에서 밝혔다. 그는 다른 이들의 저작물을 부분적으로 편집, 활용하여 구글 애드(Google ads)를 통해 광고수익을 창출하려 했다고 고백했다.

그러나 그는 스크래핑의 유해성, 심각성에 대해 블로거들이 너무 과장된 태도를 보이고 있다고 지적했다. 그는 블로거들은 언덕을 산으로 만들 정도로 모든 것을 과장하는 경향이 있는 것 같다고 말했다.

그레이는 자신이 운영한 사이트가 DMCA의 공정한 사용(fair use) 조항의 적용을 받았다고 주장했다. 공정한 사용 조항은 사람들이 저작권자의 허락 없이도 해당 저작권의 일부분을 사용할 수 있도록 규정한 조항이다.

그러나 이 조항의 보호를 받기 위해서는 해당 저작물을 비 상업적인 용도로 사용해야 한다고 저작권법에 정통한 정보 기술 전문 변호사 데니스 케네디는 밝혔다.

그는 무단 게재를 일삼는 전문 인력을 찾기란 쉬운 일이 아니다. 만약 찾았다 하더라도 만약 그가 미국 밖에 있는 사람이라면, 그를 법정으로 불러 세우기란 쉬운 일이 아니다라고 말했다. 법정 공방이 시작되면 실제 블로그의 가치보다 더 많은 비용이 소모되고, 결국 원고 측 입장에서도 어느 정도 손해를 감수할 수밖에 없기 때문이라고 그는 덧붙였다.

RSS 피드를 제공하는 사이트라면 저작물이 스크랩 되는 것은 불가피하다고 플래저리즘 투데이(Plagiarism Today)의 웹마스터 조나단 베일리는 말했다. 일반적으로, 무단 게재를 자행하는 사람들은 허브 향 비아그라 스팸 메일을 뿌리는 부류의 사람들과 비슷한 수준일 가능성이 높다고 그는 덧붙였다.

그는 블랙 햇 검색 엔진 옵티마이저(SEO)는 이들 스크래퍼의 구글 검색 랭킹을 상승시켜 주거나 구글 애드센스 광고들을 최대한 노출시켜주는 역할을 하고 있다고 말했다.

이 뿐만 아니라 영악한 스크래퍼들은 시간당 수천 편의 글을 무단 게재하는 것에 그치지 않고, 글 안의 몇몇 단어들을 동의어로 고치는 방식의 소프트웨어도 개발, 활용하고 있다고 그는 밝혔다. 즉, 고양이(cat)이라는 단어를 동일한 의미로 쓰이는 feline로 바꾸어 주는 소프트웨어를 사용하는 것인데, 이 때문에 블로거들이 자신의 글을 추적하는 데 애를 먹고 있다.

이러한 기상천외한 방법들을 동원하는 덕분에 스크랩한 사이트가 오히려 검색에서 원본보다 앞에 검색되는 경우도 종종 발생한다고 그는 말했다. 그리고 몇몇 경우, 스크랩된 이미지가 원본 사이트에 핫링크(hotlink)되어 돌아오는 바람에 해당 사이트의 대역폭을 잡아먹고, 비용도 추가로 들게 하고 있다고 그는 덧붙였다.

레더는 구글에 비난의 화살을 돌리는 사람들도 있다며 이러한 스크랩 사이트의 수익 구조는 대부분 구글 애드의 잘못된 활용으로부터 창출되는 것이기 때문이라고 설명했다.

하지만 구글 역시 이러한 웹 스팸 문제를 해결하기 위해 지난 한 해 동안 많은 노력을 기울여 왔다고 구글 수석 소프트웨어 엔지니어 맷 커츠는 강조한다.

그는 무단으로 스크랩해 가기 쉬운 구조로 되어 있다는 사실은 인정한다. 하지만 과거보다는 스팸 메일을 보내기 더욱 힘들어진 것만은 사실이라고 말했다. 그는 이어 우리는 예전부터 우리의 가이드라인을 충족시키지 못한 애드센스 사용자들을 걸러내 왔다고 덧붙였다.

스크랩된 사이트들은 구글 웹마스터 센트럴(Google Webmaster Central) 사이트 섹션에 애드 바이 구글(Ads by Google) 광고를 이용해 알 수 있다고 커츠는 말했다.

스크랩된 저작물들을 통해 콘텐츠를 충원해 나가는 사이트들의 경우, 해당 페이지의 상단 또는 하단에 원본 소스로 갈 수 있는 링크를 붙이고 이 저작물은 이곳으로부터 스크랩해 온 것입니다.라는 문구를 게시하게 되면, 구글 검색 엔진이 스크랩된 글이 아닌 원본 글을 더욱 용이하게 찾아낼 수 있다.

모든 블로거들이 스크래퍼 사이트에 대해서 걱정하는 것은 아니다. 인터넷 및 무선 통신 서비스를 전문적으로 분석하는 블로그 기가OM(GigaOM)의 대표 편집장 옴 말릭은 굳이 스크래퍼들을 잡는 데 시간을 투자하지 않는다고 말했다. 너무 많기 때문이다.

그는 이들을 그리스 신화의 히드라와 비교하며 하나의 목을 자르면, 더 많은 목이 다시 솟아오르기 때문이라고 말했다. @