Umów rozmowę
Odpowiedź techniczna

Czy robots.txt blokuje boty AI i wyszukiwarek?

Robots.txt nie powinien blokować Googlebota, Bingbota i OAI-SearchBot, jeśli strona ma być widoczna w Google, Bing i ChatGPT Search.

Krótka odpowiedź

Jeśli strona ma być widoczna w Google, Bing i ChatGPT Search, plik robots.txt nie powinien blokować ważnych crawlerów: Googlebota, Bingbota i OAI-SearchBot. Samo dobre SEO nie wystarczy, jeśli bot technicznie nie może wejść na stronę.

Co powinno być jawnie dozwolone?

Najprostsza bezpieczna konfiguracja dla strony firmowej to pozwolić botom wejść na publiczne podstrony i wskazać sitemapę. W praktyce oznacza to, że w robots.txt nie powinno być reguł Disallow blokujących całą stronę, katalogi z treścią lub konkretne landing page.

Dla widoczności w ChatGPT Search szczególnie ważny jest OAI-SearchBot. OpenAI wskazuje, że strona powinna pozwalać temu botowi na crawl oraz nie blokować ruchu z publikowanych adresów IP.

User-agent: Googlebot + Allow: /
User-agent: Bingbot + Allow: /
User-agent: OAI-SearchBot + Allow: /
Sitemap z publicznymi adresami podstron
Brak globalnej reguły Disallow: / dla publicznej strony

robots.txt to nie jedyne miejsce blokady

Crawler może mieć dostęp w robots.txt, ale nadal nie widzieć strony przez ustawienia hostingu, firewall, CDN, zabezpieczenia WordPressa, nagłówki noindex albo ochronę hasłem.

Dlatego po zmianach warto sprawdzić nie tylko treść robots.txt, ale też kod odpowiedzi HTTP, meta robots, nagłówki X-Robots-Tag i to, czy ważne podstrony nie zwracają błędów 403, 404 albo 5xx.

firewall lub CDN może blokować konkretne user-agenty
wtyczka SEO może dodać noindex
ochrona hasłem zatrzymuje boty
błędy serwera utrudniają crawl
sitemap powinna zawierać aktualne adresy

Jak to sprawdzić bez komplikowania?

Na początek wystarczy wejść pod adres /robots.txt i sprawdzić, czy nie ma blokady dla całej strony. Potem warto przetestować najważniejsze URL-e: główną, usługi, poradniki i formularz kontaktowy.

Dla strony usługowej to małe ustawienie techniczne, ale bardzo ważne. Treści mogą być świetne, schema poprawne, a sitemap gotowa, ale jeśli bot nie ma dostępu, widoczność będzie ograniczona.

sprawdź https://onlineconcept.pl/robots.txt
sprawdź, czy sitemap jest podana w robots.txt
upewnij się, że ważne strony zwracają 200
sprawdź noindex na publicznych stronach
po zmianach zgłoś sitemapę w Search Console

Techniczna checklista dla botów

Najprostszy filtr przed decyzją.

01.

Googlebot ma dostęp do publicznych podstron.

02.

Bingbot ma dostęp do publicznych podstron.

03.

OAI-SearchBot ma dostęp do publicznych podstron.

04.

robots.txt wskazuje aktualne sitemapy.

05.

Ważne strony nie mają noindex ani błędów 403/404/5xx.

FAQ

Najczęstsze pytania w tym temacie.

Czy OAI-SearchBot jest potrzebny dla ChatGPT Search?

Tak. OpenAI wskazuje, że aby strona mogła być uwzględniana w ChatGPT Search, ważne jest dopuszczenie OAI-SearchBot do crawlowania witryny.

Czy Allow: / gwarantuje widoczność w AI?

Nie. To tylko warunek techniczny dostępu. Widoczność zależy też od jakości treści, autorytetu, struktury, linków, danych i tego, czy strona odpowiada na konkretne pytania.

Czy można blokować prywatne części strony?

Tak. robots.txt może blokować obszary techniczne lub prywatne, ale nie powinien blokować publicznych stron, które mają pracować na widoczność.

Chcesz sprawdzić, jak to wygląda u Ciebie?

Napisz, co masz teraz na stronie i co chcesz poprawić. Odpowiem konkretnie, od czego warto zacząć.

Wyślij zapytanie