Я был озадачен, обнаружив на сайтах Google две разные карты сайта:
http://sites.google.com/site/(name of the site)/system/feeds/sitemap
http://sites.google.com/site/(name of the site)/system/app/pages/sitemap/hierarchy
Теперь я готов задать непонятный вопрос: «Что такое карты сайта?» Я всегда думал, что они позволяют поисковым роботам видеть, что находится на сайте, как подтверждает предыдущий пример. Последний пример поставил под сомнение мои знания. Что они на самом деле? Первые предназначены только для людей, а вторые - для ползунков? Есть ли еще другие типы карт сайта?
Карта сайта может быть а) визуальным представлением структуры сайта, предназначенным для человеческой аудитории б) файлом, предназначенным для поисковых роботов (google, yahoo), которые информируют их о том, какие URL-адреса доступны для сканирования. Он часто предоставляется вместе с файлом robots.txt, который сообщает сканерам, какие URL-адреса можно индексировать, а какие нельзя. Наиболее распространенным форматом для карт сайта является XML, который позволяет указать важность URL-адреса и частоту изменения. Вы можете прочитать спецификацию в http://www.sitemaps.org/protocol.php. Необычный, но возможный формат карты сайта - это просто обычный текстовый файл, в котором URL-адреса разделяются символами новой строки. Он не такой гибкий, как формат XML, поэтому формат XML более предпочтителен для SEO. Вы можете иметь несколько карт сайта XML и связать их в индексе карты сайта. Он часто используется на крупных сайтах, поскольку протокол карты сайта ограничивает размер карты до 10 МБ. Кроме того, вы можете использовать каналы RSS или ATOM для уведомления сканеров об URL-адресах. Недостатком этого подхода является то, что вы можете просто уведомлять о новейших URL.
Термин карта сайта может иметь два немного разных значения:
Веб-страница, чтобы дать вашим пользователям обзор вашего сайта. Это ваш пример
http://sites.google.com/site/(name сайта) / система / приложение / страницы / карта сайта / иерархия
является. Просто вставьте его в адресную строку вашего браузера и посмотрите на себя.
Этот вид карты сайта представляет собой машиночитаемый (txt из xml) список URL-адресов, составляющих веб-сайт. Это своего рода карта сайта, позволяет сканерам видеть, что находится на сайте.
У вас даже может быть несколько карт сайта такого типа. Причина этого та же самая, почему у нас обычно нет всего исходного кода в одном файле. Просто управлять этим проще, если вы разделите карту сайта на несколько файлов.
В вашем примере
http://sites.google.com/site/(name of the site)/system/feeds/sitemap
«каналы» указывают на то, что это карта сайта, которая содержит URL-адреса только для RSS-каналов.
Чтобы узнать, что в нем содержится, вам придется присмотреться к нему. Один из способов сделать это - загрузить такой файл
wget http://sites.google.com/site/(name of the site)/system/feeds/sitemap
и откройте его в своем любимом текстовом редакторе.
На моем сайте в Google этот файл выглядит так:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
</urlset>
Он почти пустой. Причина, вероятно, в том, что я только что создал сайт, а записи в ленте отсутствуют.