Alojamiento desde 3,8€ mes Consigue alojamiento con xzblogs y Dreamhost a partir de 3,8€ al mes con dominio .com propio, 500 GB de espacio y 5 Terabytes de Transferencia Mensual. (más información)

robots.txt

A veces cuando eres novato en el tema del posicionamiento, piensas que lo mejor es tener cuantas más páginas indexadas en google mejor.

Esta afirmación es cierta a medias, es evidente que cuantas más páginas tengas indexadas en los buscadores, más visitas recibirás de estas. Pero hay que tener en cuenta que es mejor una página indexada y bien posicionada que 20 páginas indexadas y mal posicionadas.

Google se centra cada vez más en penalizar contenidos duplicados, y muchas veces si no nos damos cuenta estamos dejando que google indexe páginas dentro de nuestra web que tienen contenidos duplicados, por ejemplo en un blog funcionando con Wordpress como éste, si no lo impedimos google indexará todos los artículos y las páginas de los tags como por ejemplo el tag de posicionamiento de este blog y por lo tanto indexará varias veces el texto del artículo: una vez al indexar el propio artículo y más veces al indexar la página de las etiquetas que contenga.

Este hecho hará que google posicione peor el artículo en cuestión y que pierda relevancia.

La solución es evitar que google indexe todas aquellas páginas y feeds que dupliquen los contenidos, al final tan solo dejaremos que google indexe la página principal, los artículos y las páginas de wordpress.

Lo que haremos será incluir un archivo robots.txt en el directorio principal de nuestra web.

La forma de configurarlo es sencilla, lo único que tienes que hacer es especificar con User-Agent a que robot afectarán las restricciones y con Disallow especificar que páginas deseas bloquear.

Por ejemplo:
# Aplicaremos las restricciones al robot de Google
User-agent: Googlebot
# bloquearemos las páginas que empiecen por /wp- dentro de nuestra web
Disallow: /wp-
# bloquearemos las direcciones de las búsquedas para evitar contenidos duplicados
Disallow: /search
Disallow: /?s=
# bloqueamos el feed de los comentarios
Disallow: /comments/feed
# bloqueamos las páginas del índice para navegar por los artículos
Disallow: /2007/0*
Disallow: /2007/1*
# bloqueamos las páginas de las etiquetas
Disallow: /tag/

Para ver el ejemplo podeis consultar el archivo robots.txt de esta página.

Antes de poner en marcha el archivo robots.txt deberíamos comprobar que funciona correctamente y que tan solo bloquea las páginas que no nos interesa que google indexe, para ello puedes utilizar la utilidad que google incluye en sus Herramientas para Webmasters

Una vez que lo hayamos subido tambien es recomendable analizar el archivo robots.txt para analizar posibles errores que puedan hacer que los robots de los buscadores se confundan al visitar nuestra web, para ello podemos utilizar el Analizador de sintaxis de robots.txt.

Como curiosidad puedes investigar en los archivos robots.txt de las webs que visitas a menudo, incluso en archivo robots.txt de google.

Hace poco leí via ProWeblogs que en Showmoney habían llegado a incrementar las visitas procedentes de google hasta en un 1400%. Realmente me parece un poco exagerado, pero yo creo que si en tu página tienes artículos de calidad, evitando que aparezcan duplicados innecesarios en google conseguirás un incremento de visitas importante.

Artículo recuperado, escrito originalmente el 12 de marzo de 2007

Compártelo

Si te ha gustado este artículo, envíalo a Meneame, Fresqui o Seoclon

Dejanos tu Comentario

Nombre: (Requerido)

E-Mail: (Requerido)

Sitio WEB:

Comentario:

Comentarios hasta el momento »

  1. J.F. dijo

    22 de June del 2007 a las 5:21 pm

    Buen artículo. Ahora mismo se lo añado a mi Wordpress.
    Gracias y saludos.

  2. jmerodio dijo

    22 de June del 2007 a las 5:46 pm

    Interesante artículo, pero si tu creas contenidos originales para tu web y otras páginas te lo plagian, ¿afectará eso negativamente a tu posicionamiento por contenido duplicado?

    saludos

  3. David Villarreal dijo

    23 de June del 2007 a las 12:04 pm

    En teoría los contenidos duplicados pueden perjudicar al posicionamiento, pero solo si los contenidos son exactamente iguales

    Si tan solo han cogido un extracto de tu página no creo que perjudique demasiado

  4. SpamLoco dijo

    23 de June del 2007 a las 9:57 pm

    ¿Como sería el caso de subir el robots.txt en Blogger?.

    Se sube como un archivo cualquiera con nombre ”robots.txt” y ya queda en el directorio principal?.

    Saludos.

  5. Javier dijo

    3 de July del 2007 a las 11:12 pm

    Hola me parece exelente este articulo pero me cuesta un poco entenderlo, mira quisiera meter ese robot a mi pagina de blogspot.com
    pero no se como, me podrias ayudar, estoy dispuesto a pagarte via paypal si me dices como hacer un robot.txt para blogger

  6. Marketing Digital dijo

    3 de December del 2008 a las 12:56 am

    Gracias buen aporte ¡¡
    Lo del contenido duplicado, me habia comentado uno de nuestros asociados en seo, que ya no estaba siendo penalizado ???

  7. kaztro dijo

    16 de December del 2008 a las 4:26 pm

    Hola, esta muy bueno el post, pero te hago una pregunta en los blogs como subis el txt?
    si mal no entendi, tenes que generar un txt y subirlo a tu directorio para que el robot de google te encuentre, pero en un blog como lo haces?

    Gracias!

  8. Marcos dijo

    25 de November del 2009 a las 11:07 pm

    Buenas!!! parece realmente interesante … yo me baje el plugin de “all in one seo pack” tiene opciones como no indexar categorias no indexar tags y archives. puede que le sirva a alguien que no se da maña con robots.txt.

    me gustaria pedirte un favor.cuando tengas un tiempo puedes ver mi web y decirme que opinas … yo estoy leyendo mucho y bueno trato de mejorar dia a dia… pero bueno me seria de mucha utilidad la opinion de un SEO profecional.

    muchas gracias y suerte a todos

    Marcos

  9. barcelona easy dijo

    15 de January del 2010 a las 3:01 pm

    Me he encontrado con este articulo por casualidad dias antes de empezar a crear un blog que creo que va hacer importante en su categoria y sin esta informacion no hubiera tenido tanta relevancia en la red. Gracias

Comentarios RSS · TrackBack URI

Blogs que han enlazado este artículo»

  1. Usar las categorías como keywords » xzBlogs

    17 de March del 2007 a las 2:45 pm

  2. » xzBlogs

    30 de March del 2007 a las 2:07 pm

  3. Cinco Trucos para mejorar tu posicionamiento » xzBlogs

    30 de March del 2007 a las 2:08 pm

  4. Seo Profesional » Posiciona tu blog 5 - Tu blog de Posicionamiento Web, Diseño Web, Hosting y Dominios

    31 de March del 2007 a las 5:14 pm

  5. Guía de Posicionamiento de Blogs » xzBlogs

    19 de May del 2007 a las 6:02 pm

  6. Truco Experto » Blog Archive » Como posicionar un blog

    19 de May del 2008 a las 7:51 pm