Contenido duplicado y copiado, como encontrarlo en otros sitios web, en nuestra página y qué hacer cuando nos copian - TECNOXPS

Páginas

lunes

Contenido duplicado y copiado, como encontrarlo en otros sitios web, en nuestra página y qué hacer cuando nos copian


El contenido copiado es perseguido por Google Penguin y Google Panda al igual que el contenido duplicado, lo mejor es el contenido original para nuestro sitio, SEO

El contenido duplicado hoy en día es un verdadero problema para los sitios web, se debe tener contenido original porque de los contrario el sitio se verá fuertemente afectado, por ello es importante eliminar el contenido duplicado y/o copiado que pueda existir en el sitio en cualquiera de sus formas; el SEO dejo de ser una estrategia netamente de código y de enlazamiento desde que Google Panda y Penguin andan por la red, ahora el contenido original es el rey aunque la calidad del mismo prevalecerá.

Cuando nosotros mismos escribimos un articulo o un post normalmente ello nunca nos causará ningún problema, es normal que algunos que se quieran pasar de listos copiando contenido de varias páginas web haciendo una "colcha de retazos" de contenido copiado de varios sitios, otros simplemente copian todo el texto sin siquiera colocar al final el enlace como referencia a la página o sitio de donde lo extrajeron, y por supuesto existen los sitios web con scripts que copian todo el contenido, ello existe y existirá.

Google está trabajando para pulir sus algoritmos (Google Panda y Google Penguin) y los actualiza constantemente para evitar causar daño a los sitios que crean contenido original sobre los que lo copian, reproduciéndolo en sus webs y muchas veces posicionándolo mejor en los resultados de una búsqueda (SERP) que el sitio que creó el contenido original; no se debe perder de vista que también priman otros factores como que el sitio del contenido original no esté utilizando técnicas penalizadas por Google y no esté en sanción algorítmica o en sanción manual entre muchos otros factores, hacer una cosa bien no implica que otras van a ser omitidas o no serán tenidas en cuenta.

Google tiene un formulario para informar sobre casos donde el contenido copiado posiciona mejor que el contenido original y llenando dicho reporte Google toma los casos de ejemplo para pulir sus algoritmos.

A continuación podremos ver algunos casos y algunas formas de afrontar cada uno de ellos.


Verificar el contenido que los usuarios quieren publicar en el sitio
Para muchos es importante verificar el contenido que quieren ingresar los usuarios al sitio, para que ello no se tome como contenido copiado, lo más recomendable es verificar el contenido (fragmentos de 16 palabras aproximadamente) en Google entre comillas, ello entregará una idea clara si el contenido es original o proviene de otro sitio.

También existen sitios que permiten verificar el contenido como PlagiarismChecker, pero lo más recomendable es la búsqueda directa en el motor de búsqueda que queramos verificar (Google, Bing o Yahoo) para estos casos.

Nuestro contenido original ha sido copiado y ¿ahora qué hago?
Muchas veces lo que queremos es verificar si el contenido de nuestra web ha sido copiado y que ver si otros están utilizando nuestro contenido como propio; que copien nuestro contenido no es del todo malo sobre todo si colocan un enlace a nuestro sitio,  y más aun cuando hemos realizado el trabajo de acreditación correctamente, pero de vez en cuando es bueno tomar los recaudos necesarios en el caso de que debamos hacer una denuncia ante Google sobre un sitio spammer.

Copiar contenido no es una buena idea, puedes terminar denunciado y penalizado por Google, SEO

Sitios como Copyscape permiten verificar si el contenido de nuestro sitio aparece en otras webs, utilizando la herramienta de manera gratuita obtendremos solo 10 resultados, pero ello será una buena guía y punto de partida.

Si tenemos la sospecha o el indicio de que un sitio está copiando nuestro contenido o parte del mismo, desde Webconfs podemos verificar con la dirección de nuestro sitio web y del sitio del que tenemos sospecha, si existe una semejanza entre los dos sitios, esto se mostrará a modo de resultado mediante un porcentaje que de estar por encima de un 10% (preferiblemente menos de un 5%) aproximadamente podría estarnos indicando un problema, ello podría indicar copia de contenido o contenido duplicado, sin embargo,  no se debe descartar que para los casos de contenido muy estándar se pueden ver como si fuera  contenido duplicado y para dicho caso cabe la posibilidad que el problema no sea del otro sitio sino del propio.

Si un sitio te está copiando el contenido (un scraper) puedes tratar de localizar el webmaster o si no puedes encontrar en la página la forma de contactarlo, puedes buscar el contacto del responsable del sitio con who.is, donde puedes conocer a nombre de quien está registrado el dominio y el email de contacto, (aunque pudiera darse el caso de no encontrarse el email); una vez tengas (a veces toca ingeniárselas) el email de contacto, puedes pedirle que deje de copiar tu contenido de una buena manera, algo como:

Reciba un cordial saludo,

Mi nombre es [Nombre] y soy el propietario (responsable, administrador, etc.) del sitio [DominioFull] cuyo contenido he detectado que ha estado copiando es su sitio web [DominioSitioScraper] de manera total o parcial sin autorización expresa de mi parte, por lo tanto, le solicito cordialmente que retire dicho contenido de su sitio web  y no realice dichas acciones nuevamente.

Si en el plazo de 15 días no retira dicho contenido de su sitio web, interpretaré ello como una negativa a retirar el contenido y la ratificación de no querer hacerlo, por lo tanto, emprenderé las acciones legales pertinentes para la protección del mismo y obtener la compensación por los daños causados (aquí se puede esgrimir la ley acorde de cada país entre otras) y de igual manera, informaré a su servicio de hosting (para ello sirve el who.is) y realizaré la denuncia respectiva en Google AdSense (esto en el caso que el sitio tenga AdSense) y ante Google sobre las infracciones que su accionar profiere a mi persona, mi marca y mi empresa (si es del caso para cada una).

Agradeciéndole mucho la atención prestada,

Con esto seguramente no le queden muchas ganas de hacerlo de nuevo ;-D

Es muy probable que después de esto el sitio scraper no se quiera exponer a ello y más aun cuando se esgrime lo del servicio de hosting, AdSense y la misma Google, que de ser el caso y tocase informar al servicio de hosting, nos ponemos un poco más serios en ello con algunas leyes esgrimidas, etc.; muy probablemente el servicio de hosting para no verse envuelto en problemas legales y ante Google, obligará a su cliente a rectificarse o lo eliminará (baneo directo) de su host.
Ahora, si la practica de copiado de contenido es muy grave se puede enviar copia de una vez al servicio de hosting del primer mensaje para que el sitio scraper tenga muy presente que el asunto va muy en serio.  o-O""


Aquí encuentras los enlaces para realizar las denuncias respectivas ante Google
El enlace para realizar la denuncia respectiva ante Google AdSense por la violación de nuestros derechos de autor.
El enlace para realizar la denuncia ante Blogger por la violación de nuestra autoría en los contenidos.


Es muy importante, pero muy importante que para estos procedimientos tengamos debidamente acreditados nuestros contenidos ante Google.
Acreditar el contenido original con el perfil en Google+ en nuestro sitio web nos brinda muchas herramientas para proteger nuestro contenido, SEO
Acreditar la autoría del contenido original con el perfil de Google+
Acreditar el contenido original con PingShot en FeedBurner nos brinda una herramienta mas para proteger nuestro contenido, SEO
Acreditar el contenido con el PingShot en FeedBurner


Cuando el contenido de nuestro sitio está duplicado
Muchas veces el contenido duplicado puede estar en nuestro sitio debido a direcciones duplicadas por no realizar los redireccionamientos adecuados al mover un directorio o enlace, por ello se debe realizar los redireccionamientos 301 y en otros casos se debe realizar la canonicalización mediante el atributo rel="canonical".
Un sitio que tenga varias páginas con contenido igual o similar puede establecer  mediante el canonical cual es la página principal dentro del conjunto de páginas que tienen el mismo contenido o cuyo contenido es muy parecido en un gran porcentaje.

Un sitio con una herramienta que nos permite verificar si tenemos direcciones duplicadas es Cuwhois, donde solo debemos introducir la dirección del sitio web y si dentro de los resultados aparecen resultados en azul (aparecen dos direcciones con "cod: 200 - OK") significará que existe duplicidad en dos enlaces que debe ser corregida.
El contenido copiado es perseguido por Google Penguin y Google Panda al igual que el contenido duplicado, lo mejor es el contenido original para nuestro sitio, SEO
Sin problemas de duplicidad


Como saber con Google si existe contenido duplicado
Para entender que Google si identifica resultados que son  muy similares se puede hacer un experimento, introducimos el dominio de nuestros sitio (sin el "www" y sin el ".TipodeDominio", solo el nombre) en el buscador de Google y este nos arroja resultados, para lo cual debemos irnos hasta la última página de los resultados [1...10... 20... 30, etc.], hasta verificar si encontramos algo como: "...hemos omitido... XYZ resultados... si quieres repetir tu búsqueda incluyendo lo que se han omitido", al encontrarnos con este mensaje se nos está diciendo que existen otras resultados que pudieran ser contenido duplicado propio o también de otros sitios donde se relaciona nuestro dominio, tales como directorios, sitios donde testeamos nuestra página web entre muchos otros; está es la forma en la que Google nos deja saber que puede identificar resultados similares que impliquen de una u otra forma nuestros sitio web.

El contenido copiado es perseguido por Google Penguin y Google Panda al igual que el contenido duplicado, lo mejor es el contenido original, SEO

Si hacemos el mismo experimento anterior pero colocando en el buscador de Google el comando "site:DominioFull" (en este caso si es completo) y si al irnos al final de los resultados encontramos "... puedes  repetir la búsqueda incluyendo los resultados omitidos.", entonces podremos ver que existe contenido que se está viendo como duplicado en el sitio propio y se debe corregir rápidamente.
Si al utilizar site:DominioFull en Google con tu dominio no aparece la opción "... repetir la búsqueda incluyendo...", ¡excelente!, eso es lo que se debe tener.


Copiar contenido parcial o totalmente, duplicar el contenido propio, contenido muy "estándar" e incluso la falta de contenido, nos puede hacer ver ante Google como un sitio con malas prácticas o como un sitio poco relevante, por lo cual es importante eliminar el contenido que haya sido copiado y/o se encuentre duplicado y tomar rápidamente los correctivos pertinentes.



Si Fox Mulder está por aquí quiere decir que

Esto parece un X-Files sin Aliens...

Nota: sólo los miembros de este blog pueden publicar comentarios.