Sitemap.xml — это специальный файл, где собраны все ссылки на страницы сайта, которые следует проиндексировать в поисковых системах (ПС), например, в Яндекс или Google. В нашей статье мы простыми словами расскажем, для чего необходим файл sitemap.xml, какие к нему предъявляются требования, а также покажем несколько бесплатных генераторов сайтмап.
Зачем нужна карта сайта sitemap.xml
Файл sitemap.xml — это своеобразная карта сайта, которая показывает поисковым роботам, какие страницы веб-ресурса должны попасть в индекс ПС. Sitemap.xml рекомендуется создавать, чтобы:
быстро проиндексировать определенные страницы сайта;
оповестить поисковые системы об обновлении веб-ресурса;
показать частоту обновления ресурса;
определить важность страниц среди всего веб-ресурса.
Требования к файлу
Требования к файлу от ПС Яндекс:
Рекомендуемый формат файла — XML.
Обязательный элемент в файле — loc (адрес страницы).
Значение элемента priority находится в интервале от нуля до единицы, где 0 — самый низкий приоритет, а 1 — самый высокий. Робот Яндекса загружает веб-страницы в порядке очереди с учетом наличия и значения данного коэффициента.
Необходимо применять кодировку UTF-8.
Лимит по числу ссылок в одном файле — 50 тыс.
Ограничение по размеру файла в несжатом виде — 50 МБ.
Ссылки в сайтмап должны вести только на то доменное имя, где расположен файл.
Файл должен быть доступен для поисковой системы — сервер должен возвращать HTTP-код 200.
Требования к файлу от ПС Google:
В файл возможно добавить дополнительные сведения о контенте разных типов, например, для видеофайлов и изображений. Для видео: длина ролика, категория, ограничение по возрасту. Для изображений: изображенный объект, тип, условия лицензирования.
Указывайте полные URL, используя один и тот же синтаксис.
Не указывайте в добавляемых URL идентификаторы сеансов.
С помощью атрибута hreflang можно указать версии сайта на другом языке.
Кодировка файла — UTF-8.
Требования по общему числу страниц и размеру файла аналогичны Яндексу. Рекомендуется разбивать слишком объемные файлы sitemap на части.
В файле должны присутствовать только канонические адреса страниц.
Пример того, как выглядит часть карты сайта нашего проекта.
В ней перечислены все важные страницы нашего сайта, которые должны попасть в поиск.
В каких случаях понадобится sitemap.xml
Если размер вашего веб-проекта очень велик. Файл сайтмап поможет поисковым роботам не пропустить новые страницы.
Если на сайте присутствует много страниц, не связанных друг с другом. Их лучше отобразить в сайтмап, чтобы поисковый робот их нашел и добавил в индекс.
Если сайт создан недавно и на него ведет небольшое количество внешних ссылок.
На сайте расположено много мультимедийного (видеофайлы, изображения) или новостного контента.
Запомните, что поисковые системы не гарантируют попадание веб-страницы в индекс даже при наличии на нее ссылки в карте сайта.
Бесплатные генераторы sitemap.xml
Сайтмап можно создать вручную или сгенерировать файл автоматически. Ниже мы покажем примеры бесплатных генераторов, которые помогут создать карту сайта.
Mysitemapgenerator
Бесплатная версия инструмента подходит для небольших проектов (до 500 URL). Есть возможность создать карту сайта как в формате XML, так и в HTML. Просто введите URL проекта и нажмите кнопку «Перейти к созданию».
Majento
Инструмент позволяет в режиме онлайн сгенерировать карту сайта до 500 страниц. Есть функции: формировать lastmod, priority, changefreq, игнорировать содержимое noindex и ссылки nofollow, учитывать директивы в robots.txt.
XML-sitemaps
Еще один онлайн-генератор с ограничением по URL в пятьсот штук. Регистрация не требуется, вы сразу же получите готовую карту сайта. Вы сможете скачать файл карты сайта в формате XML или получить его по электронной почте, а потом разместить на своем веб-сайте.
Gensitemap
Разовое сканирование сайта до 1000 страниц обойдется вам бесплатно. Просто введите полный адрес сайта и электронную почту (на нее придет оповещение об окончании сканирования).
Htmlweb
Инструмент от htmlweb позволяет бесплатно сканировать до 500 страниц сайта. Есть дополнительные функции: понижать приоритет по подпапкам, брать last-modified из заголовка или в ссылки вставлять title страницы.
Заключение
Таким образом, файл sitemap нужен для качественной и быстрой индексации вашего сайта. Поисковые системы, скорее всего, и без него найдут страницы вашего веб-ресурса, но sitemap.xml облегчает и ускоряет этот процесс. Если у вас остались вопросы, задавайте их в комментариях. Мы обязательно ответим. Спасибо, что дочитали!
Факторы ранжирования — это совокупность факторов и признаков, по которым поисковые системы понимают, на каком месте должна отображаться страница сайта в поисковой выдаче.
Robots.txt — это специальный текстовый файл, с помощью которого можно управлять индексацией страниц сайта в поисковых системах (ПС), например, Яндекс и Google.