Mapa strony internetowej – podstawowe informacje
Słyszałeś, że warto mieć plik sitemap swojej strony lub przeczytałeś w audycie, że Twoja mapa witryny wymaga poprawy, ale nie wiesz co to jest? Spokojnie! W tym artykule odpowiemy na podstawowe pytania na temat mapy strony internetowej – czym dokładnie jest, dlaczego jest tak ważna w kontekście SEO oraz jak ją stworzyć i gdzie umieścić, aby spełniała swoje zadanie.
Co to jest mapa strony internetowej?
Mapa witryny (z ang. sitemap) to najczęściej plik w formacie XML, który zawiera listę wszystkich ważnych adresów URL podstron witryny. Stanowi ona źródło informacji o strukturze strony internetowej i wykorzystywana jest przez wyszukiwarki. Dzięki mapie roboty sieciowe wiedzą, które podstrony powinny znaleźć się w ich indeksie.
Mapa strony może zawierać również inne informacje, np. o zamieszczonych filmach i plikach, alternatywnych wersjach językowych witryny lub datach ostatnich aktualizacji podstron. Standardowo można ją podejrzeć, dodając po adresie domeny „/sitemap.xml” lub „/sitemap_index.xml„.
Warto również wspomnieć, że istnieje mapa strony w formacie HTML. Jest to graficzne przedstawienie struktury witryny, które jest szczególnie przydatne dla użytkowników większych stron internetowych. Jednak w tym artykule skupimy się na omówieniu pliku sitemap.xml.
Dlaczego mapa strony internetowej jest potrzebna?
Posiadanie mapy strony nie jest bezpośrednim czynnikiem wpływającym na pozycjonowanie. Mapa strony WWW jest jednak ważna w kontekście SEO, ponieważ dzięki zawartej informacji o wszystkich podstronach, pomaga wyszukiwarkom w szybszym i dokładniejszym indeksowaniu witryny. Nie zostaną zatem pominięte żadne adresy URL, które trudno znaleźć lub do których nie prowadzą wewnętrzne linki (tzw. strony osierocone, z ang. orphan pages).
Dodatkowo mapa strony internetowej pozwala na kontrolę procesu indeksowania i aktualizowania informacji na stronie. Jest to szczególnie istotne w przypadku witryn posiadających wiele podstron lub stron generowanych dynamicznie, np. przez systemy zarządzania treścią (CMS). Mapa strony w formacie XML może zawierać informacje o priorytetach i częstotliwości aktualizacji poszczególnych podstron.
Co powinna zawierać mapa strony internetowej?
Mapa witryny powinna zawierać tylko aktualne podstrony, wartościowe dla użytkowników. Dla większości serwisów są to strona główna, strony z produktami i kategoriami produktów, blog, artykuły i kategorie blogowe oraz inne strony informacyjne. W ogólności powinny to być strony:
- zwracające kod 200,
- kanoniczne,
- niezablokowane w pliku robots.txt.
Jak wygląda plik sitemap.xml?
Poniżej możemy zobaczyć przykładową strukturę mapy witryny.
<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>http://www.example.com/</loc> <lastmod>2005-01-01</lastmod> <changefreq>monthly</changefreq> <priority>0.8</priority> </url> </urlset>
Mapa strony internetowej składa się z kilku tagów. Wśród nich wymagane są:
- <urlset> – odnosi się do aktualnego standardu protokołu,
- <url> – tag nadrzędny dla każdego adresu URL,
- <loc> – zawiera ścieżkę dostępu do adresu URL strony, powinien być to adres bezwzględny, czyli zaczynający się od protokołu (np. http lub https).
Wszystkie inne tagi są opcjonalne. Ich obsługa może się różnić w zależności od wyszukiwarki. Należą do nich:
- <lastmod> – zawiera datę ostatniej modyfikacji strony, która powinna być w formacie W3C Datetime. Format ten pozwala na pominięcie części czasowej i użycie schematu YYYY-MM-DD. Dzięki tej informacji roboty wyszukiwarek mogą łatwo określić, które strony wymagają ponownego zaindeksowania.
- <changefreq> – określa częstotliwość wprowadzanych zmian na stronie. W przykładzie ustawiono co miesiąc (monthly), ale można użyć również innych wartości: daily, weekly, yearly itp. Należy pamiętać, że wartość tego taga jest traktowana jako wskazówka, a nie wymóg. Może się zatem zdarzyć, że strona z ustawioną wartością yearly będzie częściej indeksowana niż strona z monthly.
- <priority> – określa priorytet strony w stosunku do innych stron witryny, podawany w zakresie od 0.0 do 1.0, gdzie 1.0 oznacza najwyższy priorytet. Domyślna wartość to 0.5.
Więcej informacji odnośnie tagów oraz schematu sitemap można przeczytać w dokumencie opisującym protokół map witryn.
Co nie powinno znaleźć się w mapie witryny?
Wiemy już, co powinno się znajdować w mapie strony, dlatego warto również zaznaczyć, czego należy unikać. Nieprawidłowe lub niepotrzebne informacje mogą negatywnie wpłynąć na indeksowanie witryny, a co za tym idzie – na jej pozycję w wynikach wyszukiwania.
W pliku sitemap.xml nie powinny znajdować się adresy URL:
- zwracające błąd 404,
- zawierające przekierowania 301 lub 302,
- niekanoniczne, czyli zawierające w tagu „canonical” inną stronę kanoniczną,
- zablokowane do indeksacji, czyli zawierające atrybut „noindex”,
- zablokowane w pliku robots.txt.
Jeśli mapa strony zawiera takie adresy, należy je z niej usunąć. Warto zatem regularnie monitorować i aktualizować plik sitemap.xml, aby zapewnić jego poprawność i skuteczność.
Jak utworzyć mapę strony?
Istnieją różne sposoby, aby stworzyć mapę strony internetowej. Oto kilka z nich:
Narzędzia dedykowane systemom CMS: Wiele popularnych systemów zarządzania treścią, takich jak WordPress czy Magento, oferuje specjalne wtyczki SEO. Generują one plik sitemap.xml w sposób automatyczny. Wystarczy je zainstalować i odpowiednio skonfigurować. I tak przykładowo dla WordPress mapę strony można wygenerować przez wtyczkę Yoast SEO. Są również platformy CMS, np. Shopify, które mają wbudowaną funkcję generowania mapy i nie trzeba instalować dodatkowych narzędzi.
Generatory map strony internetowej: Istnieją specjalne narzędzia online, które automatycznie generują mapę strony internetowej na podstawie adresów URL dostępnych na stronie. Wymagają one tylko podania adresu strony głównej. Należy jednak pamiętać, że darmowe wersje takich narzędzi mają zwykle limit podstron, które mogą uwzględnić. Przykładem jest Screaming Frog, który w wersji darmowej wygeneruje mapę do 500 podstron.
Ręczne utworzenie pliku sitemap.xml: Mapę strony można utworzyć również ręcznie przy użyciu zwykłego edytora tekstowego. Należy wtedy zapisać plik w formacie XML i umieścić w nim wszystkie pożądane adresy URL strony według schematu pokazanego wcześniej.
O czym warto pamiętać przy tworzeniu mapy strony internetowej?
Plik sitemap.xml ma swoje ograniczenia i zasady generowania. Istnieją również pewne czynniki, o których warto pamiętać przy tworzeniu mapy strony, aby zapewnić jej skuteczne działanie:
Rozmiar mapy strony: istnieją ograniczenia dotyczące rozmiaru – rozpakowany plik nie może mieć więcej niż 50 MB lub zawierać więcej niż 50 tys. adresów URL. Jeśli tak jest, mapę witryny należy podzielić na mniejsze, których ścieżki dostępu można umieścić w indeksie map witryn. Jest to częsta praktyka np. w przypadku wtyczki Yoast SEO, która generuje nam kilka map – osobno dla produktów, artykułów blogowych, autorów itd. Wyszczególnia je właśnie w zbiorczym indeksie, który przykładowo mógłby wyglądać w taki sposób:
Lokalizacja mapy strony: zaleca się umieszczenie pliku sitemap w katalogu głównym witryny. Wiele robotów wyszukiwarek automatycznie szuka pliku sitemap.xml w katalogu głównym strony internetowej. Umieszczenie go tam pozwala zatem na łatwiejsze i szybsze indeksowanie wszystkich podstron witryny.
Informacja o mapie strony: warto poinformować wyszukiwarki, w szczególności Google, gdzie znajduje się mapa strony WWW. Najlepiej przesłać jej adres w Google Search Console. Opis jak dokładnie to zrobić znajduje się poniżej. Warto również wskazać ścieżkę dostępu do mapy strony w pliku robots.txt. Dyrektywa „Sitemap:„, którą należy użyć, jest niezależna od linii user-agent. Nie ma zatem znaczenia, gdzie zostanie umieszczona w pliku, jednak zwykle dodaje się ją na końcu. Można również podać kilka adresów map. Jeśli mamy plik indeksu map witryn, wystarczy podać tylko jego lokalizację.
Sitemap: http://www.example.com/sitemap.xml
Podstawowe informacje jak przygotować i udostępnić mapę witryny znajdziemy również w dokumentacji Google.
Jak dodać adres mapy w Google Search Console?
Adres mapy witryny dodaje się w Google Search Console w następujący sposób:
- Zaloguj się do swojego konta Google Search Console i wybierz odpowiednią witrynę.
- Wybierz sekcję „Mapy witryn” z menu po lewej stronie ekranu.
- Wpisz adres URL pliku sitemap.xml w polu tekstowym i kliknij przycisk „Prześlij”.
- Jeśli plik został prawidłowo przesłany, zostanie wyświetlony komunikat „Pomyślnie przesłano mapę witryn”.
W sekcji „Mapy witryn” można również zobaczyć więcej szczegółów o przesłanych mapach – sprawdzić czy indeksowanie zakończyło się sukcesem lub wystąpiły jakieś błędy, ile wykryto adresów oraz kiedy był ostatni odczyt.
Warto pamiętać, że dodanie mapy witryny w Google Search Console nie gwarantuje natychmiastowego zaindeksowania wszystkich podstron na Twojej witrynie. Proces indeksowania zależy od wielu czynników.
Jeśli nie jesteś pewien, czy Twoja mapa strony jest poprawna i zoptymalizowana, nie trać czasu! Skorzystaj z naszej usługi audytu SEO Twojej witryny internetowej. Nasi specjaliści sprawdzą poprawność mapy, wykryją oraz naprawią potencjalne błędy. Skontaktuj się z nami już dziś, abyś mógł cieszyć się lepszymi pozycjami w wynikach wyszukiwania i przyciągać więcej potencjalnych klientów!
FAQ – szybkie odpowiedzi na temat mapy strony internetowej
Co to jest mapa strony internetowej?
Mapa strony internetowej, czyli sitemap.xml, to plik w formacie XML, zawierający listę adresów URL podstron witryny internetowej, które mają być w indeksie wyszukiwarek.
Jak stworzyć mapę strony internetowej?
Mapę strony internetowej można stworzyć na kilka sposobów. W przypadku korzystania z popularnych systemów CMS (np. WordPress) często wystarczy zainstalować specjalną wtyczkę SEO, która wygeneruje plik sitemap.xml automatycznie. Innym sposobem jest skorzystanie z generatorów map, które są dostępne m.in. online. Narzędzia te automatycznie generują plik sitemap.xml na podstawie adresów URL dostępnych na stronie. Mapa strony może zostać utworzona również ręcznie, przy użyciu zwykłego edytora tekstowego. W pliku należy umieścić wszystkie pożądane adresy URL według określonego schematu i zapisać go w formacie XML.
Co powinno być w Sitemap?
Plik sitemap.xml powinien zawierać informacje o wszystkich aktualnych i dostępnych podstronach witryny – ich adresy URL wraz z datą ostatniej modyfikacji. Dodatkowo można zawrzeć informacje o priorytetach i częstotliwościach aktualizacji poszczególnych podstron, umieszczonych filmach i plikach oraz alternatywnych wersjach językowych witryny.