Формат Google Sitemap (xml)
Как понятно из сабжа, речь пойдет о немаловажном аспекте при "раскрутке" любого ресурса, о построении карты сайта, точнее об удобоваримом, для роботов поисковых систем, ее представлении.
Собственно, мы рассмотрим не только google sitemap, а формат sitemap xml вообще.
Итак заготовка:
-
<?xml version="1.0" encoding="UTF-8"?>
-
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd" style="font-weight: bold; color: black;">>
-
<url>
-
<loc>http://www.yoursite.com</loc>
-
<priority>1.0</priority>
-
<lastmod>2007-03-02</lastmod>
-
<changefreq>always</changefreq>
-
</url>
-
<url>
-
<loc>http://www.yoursite.com/index.php?menu=01</loc>
-
<priority>0.9</priority>
-
<lastmod>2007-03-02</lastmod>
-
<changefreq>daily</changefreq>
-
</url>
-
-
..................
-
-
</urlset>
По порядку:
-
<b><pre><urlset></pre></b>
- содержит описание схемы документа, для "чистого" google sitemap там должно быть написано примерно следующее:
-
<b><urlset xmlns="http://www.google.com/schemas/sitemap/0.84"></b>
правда необходимости я в этом не вижу, потому как робот гугла прекрасно понимает унифицированную схему.
-
<b><url></b>
- собственно описание страницы вашего сайта, которую нужно просмотреть поисковику.
Атрибуты:
-
<loc>http://www.yoursite.com/index.php?menu=01</loc>
- url страницы сайта ОБЯЗАТЕЛЬНЫЙ
-
<lastmod>2007-03-02</lastmod>
- дата последней модификации НЕОБЯЗАТЕЛЬНЫЙ
-
<priority>1.0</priority>
-приоритет страницы (значения от 0.0 до 1.0) НЕОБЯЗАТЕЛЬНЫЙ
-
<changefreq>always</changefreq>
- частота с которой обновляется контент страницы. (значения always - говорит роботу, что содержимое страницы в кеше нужно обновлять при каждом посещении; hourly - ежечасно, daily -ежедневно, weekly - еженежельно, monthly - ежемесячно, yearly - ежегодно или never - сожержимое не обновляется - можно использовать, например для архивов)
Добавляйте максимальное количество страниц вашего сайта в SiteMap. Google поддерживает до 50000 страниц в одном XML файле.
После того, как вы создали SiteMap, вам нужно разместить его.
Для google пройдите по ссылке (требуется ваш gmail аккаунт) https://www.google.com/webmasters/sitemaps/login. После прошествия времени, обычно пары часов, проверьте, успешно ли обработан sitemap?
Если что-либо не так, исправьте и снова залейте его.
Обычно проблемы возникают из-за неправильной кодировки и/или отсутствия переноса строки на каждой строчке.
И, напоследок, вот хороший сервис для автоматической генерации sitemap разных форматов: http://www.auditmypc.com/xml-sitemap.asp
На вкладке Crawler для большинства случаев нужно увеличить таймауты (Connect Timeout и Read Timeout)
Разместить у себя на ресурсе или в ЖЖ:
На любом форуме в своем сообщении:




20 сентября, 2008 в 8:41
Проверяйте sitemap.xml внимательно, а то могут быть русские буквы или какие-нибудь польские или чешские, которые Яндекс и Гугл не понимает UTF-8 как-никак.