Kody odpowiedzi HTTP to sposób komunikacji serwera z przeglądarką, dlatego warto znać najpopularniejsze statusy, aby wiedzieć na przykład, o jakim problemie informują. Wiele z nich ma również bezpośredni wpływ na SEO. Które? O tym dowiesz się z artykułu.
Czego dowiesz się z artykułu?
Kody odpowiedzi HTTP – czym są?
Kody HTTP to, najprościej ujmując, odpowiedź serwera na żądanie klienta, np. przeglądarki. Gdy użytkownik chce wejść na daną stronę internetową, musi najpierw wpisać adres internetowy, dzięki któremu możliwe jest zlokalizowanie witryny na odpowiednim serwerze sieciowym. A przesyłanie danych na komputer lokalny użytkownika odbywa się właśnie za pośrednictwem protokołu HTTP, czyli HyperText Transfer Protocol HTTP. Serwer sieciowy musi następnie odpowiedzieć przeglądarce kodem HTTP składającym się z trzech cyfr, czy żądanie zakończyło się powodzeniem, czy wystąpił błąd lub przekierowanie. W przypadku błędu użytkownik widzi informację w postaci komunikatu na automatycznie generowanej podstronie, np. 404 Not found. Jeżeli doszło do przekierowania lub żądanie zakończyło się sukcesem, to użytkownik fizycznie nie widzi zwracanych kodów odpowiedzi HTTP, ponieważ wszystko działa prawidłowo.
Kody HTTP – rodzaje
Trzycyfrowy kod HTTP może zaczynać się od jednej z cyfr z zakresu 1-5 i według tego wyróżnika statusy dzieli się na kilka klas:
- 1xx – kody informujące o tym, że żądanie jest analizowane,
- 2xx – statusy wysyłające informacje, że serwer zrealizował zapytanie klienta,
- 3xx – kody przekierowań informujące o tym, że zawartość strony została zastąpiona żądanym zasobem,
- 4xx – błędy HTTP leżące po stronie klienta, np. nie znaleziono strony, nie można uzyskać żądanego zasobu, czyli zapytanie zostało wysłane, ale wystąpił problem z jego realizacją,
- 5xx – statusy odpowiedzi HTTP informujące o błędach leżących po stronie serwera, czyli żądanie zostało prawidłowo wysłane, ale serwer odmawia zrealizowania zapytania.
Odpowiedzi HTTP a pozycjonowanie w Google’u
Kody odpowiedzi serwera HTTP mają duże znaczenie nie tylko dla poprawności działania serwisu, ale również procesu pozycjonowania. Problemy z wyświetlaniem witryny są rejestrowane przez Googleboty. Jeśli serwer odpowiada kodem HTTP 2xx, to otrzymana zawartość jest uznawana przez roboty za taką, którą można indeksować. Jeżeli chodzi o przekierowania, Googlebot śledzi je do 10. Jak podaje sam Google, jeśli w tej liczbie robot nie zarejestruje treści, to w Search Console pojawi się błąd przekierowania. Ewentualne błędy 4xx-5xx oraz nieprawidłowe przekierowania 3xx są odnotowywane w raporcie Stan w sekcji Indeks.
Przykładowy raport Statystyki indeksowania w Google Search Console
Warto pamiętać, że podczas indeksowania Googlebot nie uwzględni tych adresów, które zwracają kod 4xx. A adresy, które zostały już zaindeksowane, a po jakimś czasie wyświetlają błąd HTTP 4xx, zostaną usunięte z indeksu. Podobnie dzieje się z adresami URL, które po zaindeksowaniu zwracają kod 5xx.
Przeczytaj także:
Czym jest crawl budget - indeksowanie w pigułceJak sprawdzić kody odpowiedzi HTTP?
Istnieją różne narzędzia, które pozwalają sprawdzić kody błędów HTTP i przekierowania, jakie zwracają strony w Twoim serwisie. Najpopularniejszym wydaje się Screaming Frog SEO Spider. Jego darmowa wersja do pobrania na komputer pozwala zeskanować do 500 adresów URL. W kolumnie Status Code znajdziesz zwracane kody odpowiedzi HTTP, które można dodatkowo posortować według typu. Listę wykrytych błędów 404 (wewnętrznych i zewnętrznych) można wyeksportować w formie pliku .xls. Warto również pamiętać, że Screaming Frog nie jest narzędziem idealnym i w przypadku pozornych błędów 404 (więcej na temat w dalszej części artykułu) może wskazywać kod 200. Dlatego nic nie zastąpi też ręcznego monitoringu i szybkiej reakcji, gdy zauważysz u siebie podejrzanie wyglądający link.
Zwracany przez daną stronę kod odpowiedzi można również sprawdzić w samej przeglądarce. Wystarczy wcisnąć klawisz F12, przejść do zakładki Sieć, następnie wybrać CTRL+R, aby zarejestrować ponowne ładowanie. Kod odpowiedzi znajdziesz w kolumnie Status.
Statusy przekierowań 3xx można z kolei sprawdzić za pomocą wtyczek do przeglądarek, takich jak Link Redirect Trace czy Redirect Path, które również z poziomu przeglądarki wskażą typ ewentualnego przekierowania na stronie.
Wtyczka Link Redirect Trace
Kody odpowiedzi serwera HTTP ważne w SEO
Niektóre HTTP kody odpowiedzi mogą okazać się kluczowe lub wręcz krytyczne dla Twojego SEO. Oto te najważniejsze.
-
Przekierowanie 301
Przekierowanie 301 jest zalecane w sytuacji, gdy jeden adres URL musi zostać na stałe przekierowany na inny. W praktyce oznacza to, że Googlebot i użytkownik zostaje przeniesiony na nowy adres URL. Co ważne, dzięki przekierowaniu 301 siła linków zwrotnych starej strony jest nadal przekazywana na nową podstronę, a kod HTTP 301 wysyła robotom sygnał o konieczności przeindeksowania witryny. Status ten jest dla użytkownika trudny do zauważenia, ponieważ adres URL w pasku strony zmienia się automatycznie.
Przekierowanie 301 bywa nazywane „najlepszym przyjacielem” specjalisty SEO. Jest przydatne w wielu sytuacjach, takich jak na przykład:
- migracja serwisu na nową domenę,
- wdrożenie certyfikatu SSL i przeniesienie strony z wersji http na https,
- błędy 404 (więcej na ich temat przeczytasz w dalszej części artykułu) spowodowane na przykład przez usunięcie niedostępnych w sklepie produktów; dzięki przekierowaniu 301 możliwe jest skierowanie ruchu na stronę o powiązanej zawartości, na przykład podstronę kategorii,
- duplikowanie się stron w wersji www i bez.
Należy jednak podkreślić, że nigdy nie ma pewności, że stronie zaindeksowanej po przekierowaniu uda się odzyskać pozycję strony wyjściowej.
Praktyki przydatne podczas wdrażania przekierowań 301 to:
- sprawdź, czy strona docelowa ma status 200,
- upewnij się, że linki zwrotne ze strony początkowej są prawidłowe,
- zminimalizuj automatyczne przekierowanie 301 na stronę główna dla wszystkich błędów 4xx,
- jeżeli strona ma zostać usunięta, ale posiada wartościowe backlinki, lepiej zastosować przekierowanie.
-
Kod HTTP 302
Kod HTTP 302 to w praktyce przekierowanie tymczasowe, czyli użytkownicy i boty Google’a są po odwiedzeniu danej podstrony przenoszeni na nową podstronę z tą różnicą, że przekierowanie 302 nie przekazuje mocy linków. Dlatego nie powinno być stosowane w przypadku trwałych zmian. Kod 302 nie wysyła też Googlebotom informacji o konieczności aktualizacji indeksu serwisu. Będą one nadal próbowały indeksować oryginalną stronę. Warto monitorować, czy http 302 odnotowane w Twoim serwisie jest rzeczywiście tymczasowe.
Praktyki przydatne podczas wdrażania przekierowań 302:
- należy ich używać tylko tymczasowo, na przykład gdy na danej podstronie trwają prace konserwacyjne,
- nie stosuj HTTP 302 dla zawartości, które zostały trwale usunięte lub przeniesione,
- jeśli przekierowanie 302 stanie się trwałe, zastąp je 301.
-
Kod odpowiedzi serwera 307
Kod odpowiedzi 307 to przekierowanie bardziej szczegółowe od 302 i jest ono wykonywane przez przeglądarkę, a nie serwer. Rolę tymczasowego przekierowania początkowo miało pełnić 302. Jednak większość klientów, m.in. przeglądarki Chrome, Firefox, zmieniła metodę żądania HTTP z POST na GET. Przekierowanie 307 było wynikiem aktualizacji HTTP. Zaleca się, aby przekierowanie 307 było używane, gdy rzeczywiście ma być tymczasowe, podczas gdy przekierowanie 302 powinno być stosowane, gdy chcesz, aby „stary” adres URL, który przekierowujesz, wyświetlał się również w SERP-ach.
-
Błąd HTTP 404
Status HTTP 404 jest jednym z najczęściej występujących błędów i oznacza, że serwer nie znalazł żądanej strony dla danego adresu URL, co w praktyce może wskazywać, że dana podstrona nie istnieje lub użytkownik wpisuje błędny adres, lub wchodzi z błędnego linku. Czasem zamiast strony z komunikatem może wyświetlać się witryna z niewielką ilością treści czy też całkowicie pusta. Błędu 404 nie należy lekceważyć, ponieważ z jednej strony Googlebot może zrozumieć, że strona nie powinna być indeksowana i usunie ją z indeksu. W ten sposób pozbędziesz się również mocy znajdujących się na niej linków zwrotnych. Z drugiej strony roboty Google’a w ten sposób mogą indeksować nieistniejące URL-e zamiast zajmować się indeksowaniem innych działających w obrębie Twojej witryny podstron.
Czasem jednak błąd 404 może paradoksalnie pomóc Twojemu SEO, zresztą sam Google nie traktuje tego kodu odpowiedzi jako szczególnie szkodliwego, ponieważ uniemożliwia indeksowanie błędnych adresów URL lub nieistniejących treści. Nadużywanie jednak takiego statusu w serwisie może skutkować wyższym współczynnikiem odrzuceń i utratą ruchu, a to już realne zagrożenie dla witryny. Dlatego z perspektywy UX warto stworzyć dedykowaną podstronę, która będzie informować użytkownika o występującym problemie.
Komunikat o błędzie 404 w serwisie onet.pl
Warto również zwrócić uwagę na pozorne kody błędów 404, które występują, gdy użytkownik jest kierowany na podstronę z informacją, że strona nie istnieje (może być ona tez pusta lub z niewielką ilością treści), gdy tymczasem wyświetla się na niej kod HTTP 200. To niezalecana praktyka w zarządzaniu stroną. Jeśli Googleboty wykryją takie przypadki, wyświetli się o tym informacja w Google Search Console w raporcie Stan.
O czym należy pamiętać w przypadku kodu HTTP 404?
- linki znajdujące się na stronie z błędem 404 są uwzględniane w linkowaniu wewnętrznym, dlatego zaleca się ich poprawienie, aby "nie rozmywać" wewnętrznej mocy linków na korzyść tych znajdujących się w stopce i menu oraz by nie marnować crawl budgetu,
- strona z komunikatem 404 powinna być zablokowana przed indeksacją poprzez meta tag robots „noindex”,
- nie jest wskazane blokowanie dostępu do strony zawierającej błąd 404 przez plik robots.txt,
- nie należy automatycznie przekierowywać każdego 404 za pomocą kodu HTTP 301.
Tak w jednym z wpisów na Twitterze John Mueller mówi o przekierowywaniu adresów 404:
„Przekierowanie 301 dla 404 ma sens, jeśli masz zastępcze adresy URL 1:1, w przeciwnym razie prawdopodobnie uznamy to za miękkie 404 i potraktujemy jak 404”.
Przeczytaj także:
Błąd 404 – czym jest i jak wpływa na SEO? -
Błąd HTTP 410
Rzadko używany błąd 410 (głównie dlatego, że wiele osób po prostu nie zna dobrze jego przeznaczenia) oznacza, że żądana strona nie jest już dostępna. W odróżnieniu od kodu HTTP 404 wskazuje, że została ona trwale usunięta i nie będzie już zastąpiona innymi zasobami. Googlebot otrzymuje więc jasno sformułowany komunikat.
Jaki wpływ na SEO ma błąd 410?
Co prawda, można ręcznie usuwać strony z indeksu, ale kod HTTP 410 może pomóc usprawnić ten proces.
- w przeciwieństwie do kodu HTTP 404 Google od razu uwzględnia otrzymaną w statusie 410 informację i usunie jak najszybciej z indeksu stronę, choć jak przyznaje nie zawsze zadzieje się to od razu, ponieważ boty indeksujące mogą jeszcze się upewniać, że strona faktycznie nie istnieje,
- status odpowiedzi 410 jest więc lepszym rozwiązaniem, gdy chcesz szybko usunąć z indeksu daną podstronę; trzeba jednak pamiętać, że taki HTTP kod jest również obarczony większym ryzykiem w przypadku błędu, ponieważ jest to działanie celowe,
- dostęp do strony 410 nie powinien być blokowany przez plik robots.txt,
- należy pamiętać o poprawieniu lub usunięciu wszystkich linków kierujących do HTTP 410.
-
Kod HTTP 503
Kod odpowiedzi HTTP 503 oznacza, że serwer jest niedostępny i użytkownik widzi komunikat, aby spróbował odwiedzić witrynę później. Powodem może być tymczasowe przeciążenie serwera lub jego konserwacja. Błąd 503 informuje wyszukiwarki, że przetwarzanie żądania zostało celowo wstrzymane, a strona będzie wkrótce dostępna, ponieważ problem techniczny jest krótkotrwały. To również sygnał dla Googlebotów, aby nie usuwały z indeksu danego adresu URL. Jeśli jednak błąd 503 będzie się długo utrzymywał na stronie, to roboty mogą go zacząć postrzegać jako trwały i może dojść do deindeksacji strony. Dlatego tak ważne jest szybkie rozwiązanie przyczyn błędów 503.
Komunikat o błędzie 503 w serwisie home.pl
HTTP kody – podsumowanie
Znajomość kodów odpowiedzi serwera HTTP jest istotna, by rozpoznać błędy wymagające naprawy lub zastosować niezbędne przekierowania, co jest istotne z punktu widzenia nie tylko prawidłowego działania serwisu, ale również SEO.