Sitemap - webhelytérkép
A webhelytérkép (sitemap) egy olyan XML-fájl vagy oldal, amely tartalmazza egy webhely összes elérhető oldalának, vidójának és egyéb tartalmaknak (pl. fájloknak) strukturált listáját. A webhelytérkép segít a keresőmotoroknak, a webhelyen található oldalak felfedezésében és indexelésében.
Fontos megjegyezni, hogy a webhelytérkép nem garantálja, hogy a keresők az összes tartalmat indexelik és megjelenítik a keresőben, de segít a keresőmotoroknak jobban megérteni és felfedezni a webhely tartalmát.
SITEMAP KÉSZÍTÉSE
A sitemap elkészítése során követni kell néhány lépést. Íme egy általános útmutató a sitemap készítéséhez:
- Az első lépés az alapvető webhelystruktúra megértése és azonosítása – tisztában kell lenni azzal, hogy mely oldalakat szeretnénk belefoglalni a webhelytérképbe. Ezek általában fontos oldalak, kategóriák, gyűjtő oldalak és bármilyen más tartalmi elemek, amelyet szeretnénk a keresőkben találatként viszontlátni.
- A sitemap formátumának kiválasztása – A leggyakoribb és ajánlott formátum az XML, amelyet a keresőmotorok, például a Google vagy a Bing könnyen értelmeznek és feldolgoznak.
- Sitemap generátor eszköz vagy bővítményt – Sok platform és tartalomkezelő rendszer (például a WordPress) rendelkezik sitemap generátorral vagy olyan bővítményekkel, amelyek segítenek a sitemap létrehozásában. Válasszuk ki a megfelelő eszközt vagy bővítményt, és kövessük az utasításokat a sitemap létrehozásához.
- Sitemap ellenőrzés – Miután elkészült a sitemap, szükséges ellenőrizni tartalmilag és formailag. Az ellenőrzéshez használható a Google Search Console-t vagy más sitemap ellenőrző eszközöz.
- Sitemap feltöltése a webhely gyökérkönyvtárába – A sitemapet nevezzük el „sitemap.xml”-nek, és töltsük fel a webhely gyökérkönyvtárába. Ez biztosítja, hogy a keresőmotorok könnyen megtalálják és feldolgozzák a sitemapet.
- Sitemap beküldése a Google Search Console-ba és Bing webmaster tools-ba – Ez lehetővé teszi hogy a Google és a Bing megtalálja és indexelje a webhely tartalmát a sitemap alapján.
FONTOS OLDALTÍPUSOK
A sitemap általában azokat a tartalmakattartalmazza, amelyekkel az a szándékunk, hogy a keresőmotorok felfedezzék és indexeljék. Néhány példa a fontos tartalmak típusaira:
- Állandó oldalak: Ez magában foglalja a kezdőlapot, az állandó tartalmat (például a Rólunk, Kapcsolat, Szolgáltatások stb. oldalakat), valamint a fontos navigációs oldalakat.
- Blogbejegyzések: Ha blogot üzemeltetünk, ajánlott a blogbejegyzéseket is felvenni a sitemapbe. Ez segít a friss tartalom felfedezésében és indexelésében.
- Termékek és kategóriák: Ha egy webáruházat vagy termékoldalakat tartalmazó webhelyet működtetünk, a termékeket és a kategóriákat is érdemes feltüntetni a sitemapben. Ez segíti a keresőmotorokat a termékek gyorsabb indexelésében és megjelenítésében a keresési eredményekben.
- Médiafájlok: Ha a webhely tartalmaz fontos képeket, videókat, hangfájlokat vagy más médiafájlokat, érdemes ezeket is belefoglalni a sitemapba. Ez segíti a keresőmotorokat abban, hogy a tartalmat releváns keresésekben megjelenítsék.
SITEMAP – ÁLTALÁNOS IRÁNYELVEK
A sitemapekre vonatkozó általános elvárásokat a webhelytérképek protokollja határozza meg.
- Abszolút URL-ek használata – Például, ha a weboldal előnyben részesített elérési útja https://www.example.com/, a sitemapben nem szabad https://example.com/(hiányzó www) vagy ./mypage.html(relatív URL)-t használni.
- A webhelytérképet a webhely gyökerében kell elhelyezni.
- A URL-ek nem tartalmazhatnak munkamenet-azonosítókat.
- A sitemap 200-as állapotkódú oldalakat tartalmazhat, ne tartalmazzon nem létező, átirányított vagy nem kanonikus oldalakat. Legyen mindig naprakész és friss.
- A sitemapet UTF-8 kódolással kell elkészíteni.
- A nagy webhelytérképek felosztása kisebb webhelytérképekre: egy webhelytérkép legfeljebb 50 000 URL-t tartalmazhat, és tömörítetlenül nem haladhatja meg az 50 MB-ot. Kitejedtebb webshop esetén szükség van webhelytérkép indexfájlra, ahol az összes sitemap felsorolásra kerül.
- Sitemapben csak a gyűjtő URL-ek szerepelhetnek (kanonikus URL-ek). Ha egy oldalnak két vagy több változata van, akkor a sitemap.xml-be csak az kerülhet, amelyet meg szeretne jeleníteni a Google keresési eredmények között. Ha webhelynek két verziója van (például www és nem www), el kell dönteni, melyik a preferált webhely, és a preferált webhely gyökerébe kell elhelyezni a sitemapet, valamint rel=canonical illetve átirányítással jelezni szükséges a preferált oldalt a kereső számára.
- Sitemap generálása, frissen tartása: Napi 1x frissítés
- URL-ek pozíciója a sitemapben nem számít, nincs hatással a Google feltérképezési sorrendjére. A Google ignorálja a <priority> és a <changefreq> értékeket.
A Google csak abban az esetben használja a <lastmod> értéket, ha az következetesen és ellenőrizhető módon (pl. az oldal tényleges utolsó módosításával összehasonlítva) pontos.
SITEMAP PÉLDA
Nagyon egyszerű XML webhelytérkép példa, amely két oldal URL-jét tartalmazza:
<?xml version=”1.0″ encoding=”UTF-8″?>
<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″>
<url>
<loc>https://www.example.com/page1.html</loc>
<lastmod>2023-06-04</lastmod>
</url>
<url>
<loc>https://www.example.com/page2.html</loc>
<lastmod>2022-06-05</lastmod>
</url>
</urlset>
+ tipp: robots.txt és ping
A sitemap biztos feldolgozására a Google Search Console beküldésén kívül használhatjuk még az alábbi két módszert:
Robots.txt – Adjuk meg a webhelytérkép elérési útját a robots.txt fájlban. A robotok megtalálják, amikor legközelebb feltérképezik a robots.txt fájlt. Szúrjuk be ezt a sort a robots-txt-be (a URL a sitemap elérési útvonala legyen):Sitemap: https://example.com/my_sitemap.xml
Ping használata – Küldjünk GET kérést a böngészőben vagy a parancssorban erre a címre, megadva az oldaltérkép teljes URL-címét:https://www.google.com/ping?sitemap=FULL_URL_OF_SITEMAP