Prosty przewodnik po konfiguracji pliku Robots.txt w PrestaShop

Robots.txt to mały, ale potężny plik, który mówi botom wyszukiwarek, jak mają wchodzić w interakcję z Twoją witryną. To jak przewodnik, pokazujący im, które strony odwiedzić (indeksować), a które pominąć (ignorować). Dobrze skonfigurowany plik Robots.txt może pomóc w SEO Twojej witryny. Właściwie nie jest to tylko dla PrestaShop, można go znaleźć na każdej stronie. Ale w tym poście omówimy, jak to działa w PrestaShop.

Domyślny plik Robots.txt w PrestaShop

Na szczęście dla użytkowników PrestaShop plik robots.txt jest tworzony automatycznie podczas procesu instalacji. Jest on skonfigurowany pod kątem potrzeb typowej witryny e-commerce. W większości przypadków nie będziesz musiał dotykać tego pliku, chyba że masz konkretny powód.

Kiedy musisz edytować plik Robots.txt, a kiedy nie

Istnieje kilka powodów, dla których możesz chcieć edytować swój plik Robots.txt. Oto kilka przykładów:

  • Jeśli masz dwie lub więcej stron z tą samą treścią (duplikaty), możesz chcieć powiedzieć botom, aby zignorowały jedną z nich, aby uniknąć kary od wyszukiwarek.
  • Jeśli dodałeś nowe strony lub sekcje do swojej witryny, możesz chcieć kontrolować, jak bardzo są one widoczne dla wyszukiwarek.
  • Być może masz strony lub pliki, które wolałbyś zachować jako prywatne (pamiętaj jednak, że instrukcje w Robots.txt to tylko rekomendacje dla wyszukiwarek)

Ale pamiętaj, że jeśli po prostu korzystasz z domyślnych funkcji PrestaShop i Twoje SEO działa dobrze, nie ma potrzeby zmiany pliku Robots.txt.

Dostęp do pliku Robots.txt

Twój plik robots.txt znajduje się w katalogu głównym Twojej witryny PrestaShop. Możesz użyć klienta FTP lub menedżera plików hostingu, aby się tam dostać w celu jego edycji.

Aby wyświetlić plik, po prostu wpisz „https://TwojaStrona.pl/robots.txt” (adres URL Twojego sklepu + „robots.txt”) w pasku adresu przeglądarki.

Generowanie pliku Robots.txt w PrestaShop

W PrestaShop możesz ponownie wygenerować plik Robots.txt bezpośrednio z back office. Oto jak to zrobić:

  1. Przejdź do strony „Preferencje >> Ruch i SEO„.
  2. Znajdź sekcję „Generowanie pliku robots.txt” na dole.
  3. Kliknij przycisk „Wygeneruj plik robots.txt„.

To wszystko, PrestaShop wygeneruje nowy plik robots.txt. Jest to przydatne, jeśli z jakiegoś powodu brakuje pliku robots.txt lub jeśli edytowałeś plik i chcesz cofnąć zmiany.

Dostosowywanie pliku Robots.txt

Plik Robots.txt jest napisany przy użyciu bardzo prostej składni tekstowej, co ułatwia jego zrozumienie i edycję. Każda reguła w pliku Robots.txt składa się z dwóch części: linii User-agent i co najmniej jednej linii Disallow.

Oto kilka krótkich przykładów:

Blokowanie wszystkiego:

1
2
User-agent: *
Disallow: /

Blokowanie tylko Googlebot:

1
2
User-agent: Googlebot
Disallow: /

Blokowanie określonego katalogu:

1
2
User-agent: *
Disallow: /private

Blokowanie określonego katalogu z wyjątkiem jednego adresu URL:

1
2
3
User-agent: *
Disallow: /private
Allow: /private/public-page

Składnia pliku Robots.txt

User-agent:

Określa to bota wyszukiwarki, do którego będzie miała zastosowanie reguła. Jeśli chcesz skierować regułę do wszystkich botów, możesz użyć gwiazdki (*). Na przykład:

1
User-agent: *

Ta reguła dotyczy wszystkich botów.

Disallow:

Po tym następuje względna ścieżka adresu URL, którą chcesz zablokować dla botów. Na przykład:

1
Disallow: /private

Ta reguła mówi botowi, aby nie indeksował katalogu „private”.

Allow:

Jest to używane, gdy chcesz nadpisać regułę Disallow dla określonej strony lub katalogu wewnątrz niedozwolonego katalogu. Na przykład:

1
Allow: /private/public-page

Konkretny bot

Jeśli chcesz zablokować określonego bota, musisz określić nazwę tego bota w linii User-agent. Na przykład, jeśli chciałbyś zablokować bota Google (Googlebot) przed indeksowaniem określonego katalogu, mógłbyś napisać:

1
User-agent: Googlebot

A następnie kod do zablokowania katalogu.

Sitemap

Możesz również podać link do swojej mapy witryny w pliku Robots.txt:

1
Sitemap: https://example.com/sitemap.xml

Testowanie pliku Robots.txt

Po zmodyfikowaniu pliku Robots.txt przetestuj go, aby upewnić się, że działa poprawnie. Możesz użyć do tego narzędzia takiego jak Google Search Console – https://www.google.com/webmasters/tools/robots-testing-tool

Lub po prostu otwórz go w przeglądarce, aby sprawdzić, czy wygląda w porządku – https://TwojaStrona.pl/robots.txt

Częste błędy

Podczas edycji pliku Robots.txt uważaj na te częste błędy:

1. Niewłaściwe umiejscowienie pliku Robots.txt: Plik Robots.txt powinien zawsze znajdować się w katalogu głównym. Umieszczenie go w innym miejscu spowoduje, że zostanie zignorowany przez boty.

2. Niepotrzebne użycie ukośnika końcowego: Dodanie ukośnika końcowego (/), gdy nie jest to potrzebne, może prowadzić do błędnej interpretacji przez boty. Na przykład „Disallow: /private/” może nie być interpretowane tak samo jak „Disallow: /private”.

3. Ignorowanie wielkości liter: Adresy URL uwzględniają wielkość liter, co oznacza, że „/Moja-Tajna-Strona” to co innego niż „/moja-tajna-strona”. Dotyczy to również dyrektyw w Twoim pliku Robots.txt.

4. Blokowanie wszystkich botów: Reguła taka jak „User-agent: *” po której następuje „Disallow: /” blokuje wszystkie boty z całej Twojej witryny. O ile nie jest to Twoim zamiarem, unikaj tej konfiguracji.

5. Nieprawidłowe użycie dyrektywy Allow: Dyrektywa „Allow” nie jest rozpoznawana przez wszystkie boty, więc używanie jej jako kompletnego środka kontroli dostępu może prowadzić do problemów.

6. Zaniedbywanie użycia komentarzy: Zapomnienie o użyciu „#” przed komentarzami może powodować zamieszanie dla botów próbujących odczytać plik.

7. Używanie Noindex w Robots.txt: „Noindex” to dyrektywa dla poszczególnych stron internetowych i nie jest rozpoznawana w pliku Robots.txt.

8. Nieaktualizowanie pliku Robots.txt: Zapomnienie o aktualizacji pliku Robots.txt w miarę rozwoju witryny może prowadzić do przestarzałych lub nieprawidłowych reguł.

9. Pozostawienie testowego pliku Robots.txt na produkcji: Zawsze pamiętaj o zastąpieniu restrykcyjnego testowego pliku Robots.txt swoim zwykłym plikiem po zakończeniu testów.

10. Używanie nieprawidłowej składni: Nawet małe literówki w dyrektywach takich jak „User-agent” i „Disallow” lub we wprowadzonych ścieżkach mogą powodować poważne problemy z tym, jak boty interpretują Twój plik Robots.txt.


Pamiętaj, że Twój plik Robots.txt to potężne narzędzie SEO. Poświęć czas na jego prawidłową konfigurację, a naprawdę może pomóc Twojej witrynie PrestaShop wyróżnić się w świecie e-commerce.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Wymagane pola są oznaczone *