Sitemap (карта на сайта): пътеводителят, който помага на google да открие всяко кътче на вашия уебсайт

Увод

Представете си, че Вашият уебсайт е голям и сложен град с много улици и сгради. За да може един нов посетител (или в нашия случай – робот на търсачка) лесно да се ориентира и да открие всички важни места, той се нуждае от карта. В света на уебсайтовете, тази карта се нарича Sitemap (Карта на сайта). Това е файл, в който изброявате уеб страниците на Вашия сайт, за да информирате Google и другите търсачки за организацията на Вашето съдържание. Създаването и подаването на Sitemap е важна стъпка в техническото SEO, която може значително да подобри обхождането и индексирането на Вашия сайт.

Какво е Sitemap и защо е важен?

Sitemap е XML файл (най-често sitemap.xml), който съдържа списък с URL адресите на Вашия уебсайт. Освен URL адресите, той може да включва и допълнителна метаинформация за всяка страница, като:

  • Дата на последна модификация (<lastmod>): Кога страницата е била променена за последно.
  • Честота на промяна (<changefreq>): Колко често очаквате страницата да се променя (напр. always, hourly, daily, weekly, monthly, yearly, never). (Google заяви, че пренебрегва този таг, защото често не е точен).
  • Приоритет (<priority>): Каква е важността на тази страница спрямо другите страници на сайта Ви (по скала от 0.0 до 1.0). (Google също заяви, че пренебрегва този таг, тъй като сайтовете често му дават висока стойност за всички страници).

Защо е важен Sitemap?

  1. По-добро и по-бързо индексиране:
    • Sitemap помага на търсачките да открият всички страници на Вашия сайт, особено ако сайтът е нов и няма много външни линкове, или ако има страници, които са „дълбоко“ в структурата и труднодостъпни чрез стандартно обхождане.
    • Помага за откриването на страници, които може да са пропуснати при нормално обхождане (напр. страници без добри вътрешни връзки).
  2. Информиране за ново или актуализирано съдържание: Когато добавите нова страница или актуализирате съществуваща, обновяването на Sitemap-а и информацията за <lastmod> (ако се използва правилно) може да сигнализира на търсачките да я обходят по-бързо.
  3. Помощ за големи сайтове: За сайтове с хиляди или милиони страници, Sitemap е от съществено значение за ефективното обхождане.
  4. Помощ за сайтове с динамично съдържание: Ако съдържанието Ви се генерира динамично, Sitemap може да помогне на търсачките да открият тези страници.
  5. Откриване на проблеми с индексирането: В Google Search Console можете да видите колко URL адреса от подадения Sitemap са индексирани, което може да Ви помогне да идентифицирате проблеми.
  6. Предоставяне на информация за специфично съдържание: Освен стандартния XML Sitemap, има и специфични типове Sitemap-ове:
    • Image Sitemap (Карта на сайта за изображения): Помага на Google да открие и индексира всички Ваши изображения.
    • Video Sitemap (Карта на сайта за видеа): Помага за индексирането на Вашето видео съдържание.
    • News Sitemap (Карта на сайта за новини): За новинарски сайтове, помага за бързото индексиране на най-новите статии.

Важно: Sitemap е препоръка за търсачките, а не гаранция, че всички изброени URL адреси ще бъдат обходени или индексирани, или че ще бъдат индексирани по-бързо. Качеството на съдържанието, структурата на сайта и други SEO фактори също играят огромна роля.

Кои страници трябва (и не трябва) да включвате в Sitemap?

Трябва да включвате:

  • Всички важни, канонични страници на Вашия сайт, които искате да бъдат индексирани.
  • Страници с уникално, качествено съдържание.
  • Началната страница, основните категории, продуктовите страници, страниците за услуги, важните блог статии, страниците „За нас“ и „Контакти“.

Не трябва да включвате (или трябва да ги изключите с noindex и да не са в Sitemap):

  • Неканонични URL адреси: Ако използвате rel=“canonical“, за да укажете предпочитана версия на страница, включете само каноничния URL в Sitemap.
  • Страници, блокирани от robots.txt: Ако сте блокирали дадена страница в robots.txt, няма смисъл да я включвате в Sitemap.
  • Страници с noindex таг: Тези страници изрично казват на търсачките да не ги индексират.
  • URL адреси с параметри, които водят до дублирано съдържание (освен ако не са канонични).
  • Страници с грешки (404, 5xx).
  • Страници с резултати от вътрешно търсене.
  • Архивни страници с ниско качество или малко съдържание (освен ако не са важни).
  • Страници за вход, потребителски профили (които не са публични), страници на кошницата в онлайн магазин и други подобни сервизни страници.
  • PDF файлове и други документи (освен ако не искате те да бъдат индексирани и намерени в търсенето).

Целта е Sitemap да съдържа само URL адреси, които са ценни за индексиране.

Как да създадем XML Sitemap?

Има няколко начина да създадете XML Sitemap:

  1. Ръчно създаване:
    • За много малки сайтове (няколко десетки страници) можете теоретично да го напишете ръчно, спазвайки XML синтаксиса. Това обаче е непрактично и податливо на грешки за по-големи сайтове.
    • Примерен XML Sitemap формат:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
   <url>
      <loc>https://www.vashiat-site.com/</loc>
      <lastmod>2024-05-20</lastmod>
      <changefreq>daily</changefreq>
      <priority>1.0</priority>
   </url>
   <url>
      <loc>https://www.vashiat-site.com/stranica1.html</loc>
      <lastmod>2024-05-19</lastmod>
      <changefreq>weekly</changefreq>
      <priority>0.8</priority>
   </url>
</urlset>
  1. Използване на онлайн генератори на Sitemap:
    • Има много безплатни и платени онлайн инструменти (напр. XML-Sitemaps.com, MySitemapGenerator), които могат да обходят Вашия сайт и да генерират XML Sitemap файл. Подходящи са за по-малки до средни сайтове.
  2. Използване на SEO инструменти за обхождане:
    • Инструменти като Screaming Frog SEO Spider могат да генерират XML Sitemap въз основа на обхождането на Вашия сайт. Те предлагат повече контрол върху това кои URL адреси да бъдат включени.
  3. CMS плъгини и вградени функции:
    • Най-лесният и препоръчителен начин за повечето потребители. Повечето модерни CMS платформи имат вградена функционалност за генериране на Sitemap или предлагат популярни SEO плъгини, които го правят автоматично:
      • WordPress: Плъгини като Yoast SEO, Rank Math, All in One SEO Pack, Google XML Sitemaps автоматично генерират и актуализират Вашия Sitemap.
      • Joomla, Drupal, Shopify, Magento и др.: Също имат вградени решения или разширения.
    • Тези инструменти обикновено автоматично актуализират Sitemap-а, когато добавяте или премахвате съдържание.

Най-добри практики за Sitemap

  • Местоположение: Обикновено Sitemap файлът (напр. sitemap.xml) се поставя в главната директория на Вашия сайт (напр. https://www.vashiat-site.com/sitemap.xml), така че да е лесно достъпен.
  • Размер и ограничения:
    • Един Sitemap файл не трябва да бъде по-голям от 50MB (некомпресиран) и не трябва да съдържа повече от 50,000 URL адреса.
    • Ако сайтът Ви е по-голям, можете да създадете Sitemap Index файл. Това е XML файл, който изброява URL адресите на множество отделни Sitemap файлове.
  • Кодиране: Използвайте UTF-8 кодиране.
  • Компресиране: Можете да компресирате Sitemap файловете си с gzip (напр. sitemap.xml.gz), за да намалите размера им. Търсачките поддържат това.
  • Динамично генериране: За големи или често променящи се сайтове, най-добре е Sitemap да се генерира динамично от Вашата система.
  • Само канонични URL адреси: Уверете се, че включвате само каноничните версии на Вашите URL адреси.
  • Пълни URL адреси: Винаги използвайте пълни, абсолютни URL адреси (включително http:// или https:// и името на домейна).
  • Консистентност: Уверете се, че URL адресите в Sitemap са същите като тези, използвани на сайта Ви (напр. с или без наклонена черта в края, ако това е стандартът Ви).

Подаване на Sitemap към търсачките

След като сте създали Вашия Sitemap, трябва да уведомите търсачките за него:

  1. Чрез Google Search Console:
    • Това е препоръчителният метод за Google.
    • Отидете в секция Индекс > Карти на сайта (Index > Sitemaps).
    • Въведете URL адреса на Вашия Sitemap файл (напр. https://www.vashiat-site.com/sitemap.xml) и кликнете „Подаване“ (Submit).
    • GSC ще Ви покаже кога е обработен, колко URL адреса са открити и дали има грешки.
  2. Чрез Bing Webmaster Tools: Подобен процес за търсачката Bing.
  3. Посочване в robots.txt файла:
    • Можете да добавите ред във Вашия robots.txt файл, който указва местоположението на Вашия Sitemap:
      Sitemap: https://www.vashiat-site.com/sitemap.xml
    • Това помага на всички търсачки (не само Google и Bing) да открият Вашия Sitemap.

Поддържане и следене на Sitemap

  • Редовно актуализирайте Sitemap-а, когато добавяте, премахвате или променяте URL адреси. Ако използвате CMS плъгин, това обикновено става автоматично.
  • Следете за грешки в Google Search Console.
  • Периодично проверявайте дали Sitemap-ът отразява точно структурата на Вашия сайт и не съдържа невалидни URL адреси.

Заключение

Sitemap е прост, но важен инструмент, който улеснява работата на търсачките и подобрява шансовете Вашето съдържание да бъде открито и индексирано своевременно. Макар да не е гаранция за по-високо класиране, той е фундаментална част от добрата техническа SEO хигиена. Като създадете точен и актуален Sitemap и го подадете на търсачките, Вие им предоставяте ясна пътна карта на Вашия уебсайт, което е от полза както за тях, така и за Вас.