Skip to content

Scrappers y violadores sofisticados de Creative Commons

En los últimos meses, varios vaces he descubierto sitios que copiaban el contenido que publico aquí y lo colocaban en su Web. A este tipo de sitios se les llama “scrappers”; usan tu feed RSS (e incluso lo que les llega vía Feedblitz) para clonar tu blog. El problema es que siempre le ponen su propia publicidad, por lo general Adsense, lo que viola la licencia Creative Commons que rige en este sitio, que sólo permite el uso de mi material en iniciativas NO COMERCIALES. En varios casos, bastó con el envío de un correo electrónico para que cesaran en la violación de la licencia CC.

Pero algunos están aprendiendo a hacer trampa de manera notablemente sofisticada. Varias de las entradas de este blog aparecen en un sitio de cursos llamados Wkilearning, que no tiene publicidad alguna, y mantiene mi licencia Creative Commons (por ejemplo, en este enlace). Pero ahora me entero que ese sitio, en realidad, es usado para luego copiar los contenidos y colocarlos en otra página web, emagister. Ésta última toma los contenidos de Wikilearning, y le pone su propia publicidad. Que una empresa como Intercom necesite hacer este tipo de maniobras para copiar el contenido de muchos sitios y blogs es realmente increíble. Intercom es dueña de sitios como Softonic y Neurona.

Hay una buena cobertura del tema en el blog Derecho y Normas, específicamente en dos entradas: Déjà Vu (Emagister, wikilearning y CC) y Wikilearning y el fraude a las licencias Creative Commons. También hay una entrada sobre el tema en Loogic. El tema ya está siendo publicado por muchos blogs, como se puede seguir a través de Technorati.

Anuncios

4 thoughts on “Scrappers y violadores sofisticados de Creative Commons Leave a comment

  1. Jorge, no es una solución al problema, pero hay un plugin para WordPress llamado AntiLeech que te permite poner paños calientes: puedes no solo bloquear el acceso de determinados IP a tus feeds, también genera contenido alterado para esos feeds:

    http://redalt.com/Resources/Plugins/AntiLeech

    Contra el copy y paste no sirve, claro.

  2. He testeado el Antileech, pero no logro hacerlo funcionar bien; creo que es incompatible con el Wp-Caché. Cuando mude el blog -porque por desgracia seguramente lo mudaré de nuevo pronto a un VPS o algo similar- y pueda sacar el WP-Caché veré que tal funciona. De todos modos, lo que me sorprende del tema Wikilearning es que una empresa tan grande esté metida en un tema así; no es simplemente un scrapper más, es un tema realmente muy serio.

  3. A mí me han plagiado incluso profesores universitarios en el sitio de una institución docente pública, sin molestarse en cambiar una sola palabra, ni en mencionar el origen del contenido. También existe un sito MFA (Made for AdSense) cuyo único contenido son dos copias idénticas de una parte de mi sitio. Por supuesto escribir al tipo que lo lleva no sirve de nada y Google se desentiende del tema, aunque es evidente quién ha copiado a quién.
    Todo esto sin contar los sitios de temáticas afines que te fusilan más o menos descaradamente.
    Este tema tiene difícil solución, por lo que parece.
    El caso que mencionas de Wikilearnig también lo había visto alguna vez y me decepciona que una empresa seria como Intercom lleve a cabo un fraude tan flagrante, que sólo le comporta un enorme desprestigio frente a los internautas de calidad.

A %d blogueros les gusta esto: