Una guía sencilla para configurar Robots.txt en PrestaShop

Robots.txt es un archivo pequeño pero potente que indica a los bots de los motores de búsqueda cómo interactuar con tu sitio web. Es como una guía, que les muestra qué páginas visitar (indexar) y cuáles omitir (ignorar). Un Robots.txt bien configurado puede ayudar al SEO de tu sitio web. En realidad, no es solo para PrestaShop, se puede encontrar en cualquier sitio. Pero en esta entrada discutiremos cómo funciona en PrestaShop.

Robots.txt por defecto en PrestaShop

Afortunadamente para los usuarios de PrestaShop, se crea un archivo robots.txt automáticamente durante el proceso de instalación. Está configurado para las necesidades de un sitio típico de comercio electrónico. La mayor parte del tiempo, no necesitarás tocar este archivo a menos que tengas una razón específica.

Cuándo necesitas editar Robots.txt y cuándo no

Hay algunas razones por las que podrías querer editar tu archivo Robots.txt. Aquí hay algunos ejemplos:

  • Si tienes dos o más páginas con el mismo contenido (duplicados), es posible que quieras decirle a los bots que ignoren una para evitar una penalización de los motores de búsqueda.
  • Si has añadido nuevas páginas o secciones a tu sitio, es posible que quieras controlar cuán visibles son para los motores de búsqueda.
  • Quizás tengas páginas o archivos que preferirías mantener en privado (sin embargo, ten en cuenta que las instrucciones en Robots.txt son solo recomendaciones para los motores de búsqueda)

Pero recuerda, si solo estás utilizando las funciones por defecto de PrestaShop y tu SEO funciona bien, no hay necesidad de cambiar tu Robots.txt.

Acceder al archivo Robots.txt

Tu archivo robots.txt vive en el directorio raíz de tu sitio PrestaShop. Puedes usar un cliente FTP o el administrador de archivos de tu alojamiento para llegar allí para editarlo.

Para ver el archivo, simplemente escribe «https://YourSite.com/robots.txt» (la URL de tu tienda + «robots.txt») en la barra de direcciones de tu navegador.

Generar Robots.txt en PrestaShop

En PrestaShop, puedes regenerar el archivo Robots.txt directamente desde el back-office. Aquí tienes cómo hacerlo:

  1. Ve a la página «Parámetros de la tienda >> Tráfico y SEO«.
  2. Encuentra «Generación de archivo robots» en la parte inferior.
  3. Haz clic en el botón «Generar archivo robots.txt«.

Eso es todo, PrestaShop generará un nuevo archivo robots.txt. Es útil si tu archivo robots.txt falta por alguna razón o si editaste el archivo y quieres revertir los cambios.

Personalizar Robots.txt

El archivo Robots.txt está escrito utilizando una sintaxis de texto muy simple, lo que lo hace fácil de entender y editar. Cada regla en un archivo Robots.txt consta de dos partes: una línea user-agent y al menos una línea Disallow.

Aquí hay algunos ejemplos rápidos:

Bloquear todo:

1
2
User-agent: *
Disallow: /

Bloquear solo Googlebot:

1
2
User-agent: Googlebot
Disallow: /

Bloquear un directorio específico:

1
2
User-agent: *
Disallow: /private

Bloquear un directorio específico excepto una URL:

1
2
3
User-agent: *
Disallow: /private
Allow: /private/public-page

Sintaxis de Robots.txt

User-agent:

Esto especifica el bot del motor de búsqueda al que se aplicará la regla. Si deseas apuntar a todos los bots, puedes usar un asterisco (*). Por ejemplo:

1
User-agent: *

Esta regla se aplica a todos los bots.

Disallow:

A esto le sigue la ruta de URL relativa que deseas bloquear a los bots. Por ejemplo:

1
Disallow: /private

Esta regla indica al bot que no rastree o indexe el directorio «private».

Allow:

Esto se utiliza cuando deseas anular una regla de Disallow para una página o directorio específico dentro de un directorio no permitido. Por ejemplo:

1
Allow: /private/public-page

Bot específico

Si deseas bloquear un bot específico, debes especificar el nombre de ese bot en la línea User-agent. Por ejemplo, si deseas bloquear el bot de Google (Googlebot) para que no indexe un directorio específico, podrías escribir:

1
User-agent: Googlebot

Y luego el código para bloquear un directorio.

Sitemap

También puedes proporcionar un enlace a tu mapa del sitio (sitemap) en el archivo Robots.txt:

1
Sitemap: https://example.com/sitemap.xml

Probar Robots.txt

Después de haber ajustado tu archivo Robots.txt, pruébalo para asegurarte de que funcione correctamente. Puedes usar una herramienta como Google Search Console para esto – https://www.google.com/webmasters/tools/robots-testing-tool

O simplemente ábrelo en tu navegador para ver si se ve bien – https://YourSite.com/robots.txt

Errores comunes

Al editar tu archivo Robots.txt, ten cuidado con estos errores comunes:

1. Colocación incorrecta del archivo Robots.txt: El archivo Robots.txt siempre debe colocarse en el directorio raíz. Colocarlo en otro lugar hará que los bots lo ignoren.

2. Uso innecesario de barra final: Añadir una barra final (/) cuando no es necesario puede llevar a malentendidos por parte de los bots. Por ejemplo, «Disallow: /private/» podría no interpretarse igual que «Disallow: /private».

3. Ignorar mayúsculas y minúsculas: Las URL distinguen entre mayúsculas y minúsculas, lo que significa que «/Mi-Pagina-Secreta» es diferente de «/mi-pagina-secreta». Esto también se aplica a las directivas en tu archivo Robots.txt.

4. Bloquear todos los bots: Una regla como «User-agent: *» seguida de «Disallow: /» bloquea a todos los bots de tu sitio web completo. A menos que esa sea tu intención, evita esta configuración.

5. Uso incorrecto de la directiva Allow: La directiva «Allow» no es reconocida por todos los bots, por lo que usarla como una medida completa de control de acceso puede provocar problemas.

6. Descuidar el uso de comentarios: Olvidar usar «#» antes de los comentarios puede causar confusión en los bots que intentan leer el archivo.

7. Uso de Noindex en Robots.txt: «Noindex» es una directiva para páginas web individuales y no se reconoce en un archivo Robots.txt.

8. No actualizar el archivo Robots.txt: Olvidar actualizar el archivo Robots.txt a medida que evoluciona tu sitio web puede provocar reglas obsoletas o incorrectas.

9. Dejar un Robots.txt de prueba en vivo: Recuerda siempre reemplazar un archivo Robots.txt de prueba restrictivo con tu archivo regular después de terminar las pruebas.

10. Usar sintaxis incorrecta: Incluso los pequeños errores tipográficos en directivas como «User-agent» y «Disallow», o en las rutas que ingresas, pueden causar problemas significativos sobre cómo los bots interpretan tu archivo Robots.txt.


Recuerda, tu Robots.txt es una potente herramienta de SEO. Tómate el tiempo para configurarlo correctamente y realmente puede ayudar a que tu sitio PrestaShop destaque en el mundo del comercio electrónico.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *