форум общения русскоязычных пользователей CMS Текстпаттерн
Вы не зашли.
Как сделать карту сайта в формате xml?
Чтоб постоянно обновлялась
Неактивен
Плагин jmd_sitemap
Неактивен
Использую этот плагин, но возник вопрос:
в Гугле все прекрасно, а Яндекс сказал, что мой файл "сплошная ошибка" - Некорректный URL (не соответствует местоположению файла Sitemap).
Из их объяснения ошибки:
"Местоположение файла Sitemap определяет набор URL, которые можно включить в этот Sitemap. Файл Sitemap, расположенный в некотором каталоге должен включать URL, расположенные в этом же каталоге, либо его подкаталогах. Подробнее см. Местоположение файла Sitemap"
Файл sitemap.xml.gz расположен в корне сайта - www.имя_сайта/sitemap.xml.gz. Ругается на все ссылки.
Кто может объяснить мне непонятливому что не так и как с этим побороться?
Неактивен
С плагином, который я привел, ПС Я работает отлично.
Проблема есть в том, что этот плагин почему-то считает меньше страниц, чем сторонние WEB-сервисы
Неактивен
itshaman написал:
С плагином, который я привел, ПС Я работает отлично.
Проблема есть в том, что этот плагин почему-то считает меньше страниц, чем сторонние WEB-сервисы
Приведите, плиз, кусочек формируемого файла.
Вот мой кусок:
<?xml version="1.0" encoding="utf-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>http://www.frozzen.name/</loc> </url> <url> <loc>http://www.frozzen.name/index.php?s=about</loc> </url> ... <url> <loc>http://www.frozzen.name/index.php?s=gallery</loc> </url> <url> <loc>http://www.frozzen.name/index.php?id=1</loc> <lastmod>2005-11-08T13:26:39+03:00</lastmod> </url> <url> <loc>http://www.frozzen.name/index.php?id=3</loc> <lastmod>2006-01-30T19:36:25+03:00</lastmod> </url> .... </urlset>
Яндекс поругался на первые 100 ссылок и прекратил обработку ввиду огромного кол-ва ошибок.
Думаю, что плагин тут ни при чем. Хотя судя по описанию он гораздо интереснее jmd_sitemap - так что все равно на него перейду когда время будет.
Но сейчас меня все же интересует вопрос с Яндексом
Неактивен
Попробовал rah_sitemap.
Файл слово в слово такой же. Сомневаюсь, что Яндекс его примет.
В чем же беда?!
зы. Почему-то мне эта история с Яндексом напомнила об одной истории из моей основной работы: Для отчетности мы формируем XML-файлы установленного стандарта. В целях "не забивать себе голову" наш файл формируется без всякого форматирования - одной строкой. Недавно появилась еще одна смежная организация, которой мы тоже шлем этот файл. Звонит оттуда тетечка и говорит: "А не могли бы вы так формировать свой файл, чтобы его удобно было в Блокноте открывать и смотреть!!! И кроме того наши программисты написали прогу, которая открывает такие файлы и запихивает данные из них в Эксель. Так вот ваш XML-файл эта прога разобрать не может, потому что нету переносов!!!".
Сдается мне, что и Яндекс XML читает как-то не так как Гугл.
Отредактированно froZZen (19-01-2010 15:00:20)
Неактивен
froZZen написал:
зы. Почему-то мне эта история с Яндексом напомнила об одной истории из моей основной работы:
[ skip ]
Сдается мне, что и Яндекс XML читает как-то не так как Гугл.
Скорее всего так и есть... ну почти как переводы строк.
Сейчас у вас в ситемапе отдается в хеадере:
Content-Type: application/x-gzip Content-Encoding: x-gzip
Попробуйте отдавать:
Content-Type: application/xml Content-Encoding: gzip
Плагин rah_sitemap именно такой хеадер и отдает. Яндекс все кушает без ошибок.
Неактивен
makss написал:
Сейчас у вас в ситемапе отдается в хеадере:
Код:
Content-Type: application/x-gzip Content-Encoding: x-gzipПопробуйте отдавать:
Код:
Content-Type: application/xml Content-Encoding: gzipПлагин rah_sitemap именно такой хеадер и отдает. Яндекс все кушает без ошибок.
А где это настраивается?
И нормально ли это будет кушаться Гуглом?
Неактивен
Хеадер задается внутри плагина, так что или править код или просто замените один плагин на другой.
Потом можете в панеле вебмастера(у яндекса и гугля) скормить по-новой sitemap яндексу и гуглю - сразу будут видны ошибки, если они есть.
ps: Если нужен rah_sitemap для 4-го php, то пропатченная версия лежит у меня на сайте.
Неактивен
Установил и опробовал rah_sitemap.
Гугл еще не проверял (но мне почему-то кажется что у него вопросов не возникнет).
А Яндекс вновь выдал ту же самую ошибку:
Некорректный URL (не соответствует местоположению файла Sitemap)
И так для каждой ссылки.
После 100 ошибки - Слишком много ошибок (обработка прекращена)
Описание ошибки:
Местоположение файла Sitemap определяет набор URL, которые можно включить в этот Sitemap. Файл Sitemap, расположенный в некотором каталоге должен включать URL, расположенные в этом же каталоге, либо его подкаталогах.
Что-то намудрили, а ЧТО не понятно...
Может все-таки кто-то знает что ЭТО за беда такая?!
Неактивен
froZZen написал:
Установил и опробовал rah_sitemap.
Гугл еще не проверял (но мне почему-то кажется что у него вопросов не возникнет).
А Яндекс вновь выдал ту же самую ошибку:
Некорректный URL (не соответствует местоположению файла Sitemap)
И так для каждой ссылки.
Какой адрес Вы отдаете Yandex`у?
Неактивен
itshaman написал:
Какой адрес Вы отдаете Yandex`у?
Неактивен
froZZen написал:
itshaman написал:
Какой адрес Вы отдаете Yandex`у?
Глупый вопрос, а сайт в яндекс-вебмастер тоже зарегистрирован с www ?
т.е. он должен быть www.frozzen.name
зы: не по теме - попутно желательно добавить в robots.txt строку
Host: www.frozzen.name
Неактивен
Надо попробовать без .gz отдать урл. Вроде как в текущем варианте ожидается архивированный вариант карты
Неактивен
sbel написал:
froZZen написал:
itshaman написал:
Какой адрес Вы отдаете Yandex`у?
Глупый вопрос, а сайт в яндекс-вебмастер тоже зарегистрирован с www ?
т.е. он должен быть www.frozzen.name
зы: не по теме - попутно желательно добавить в robots.txt строку
Host: www.frozzen.name
В Яндексе действительно без www.
А если в роботе.тхт уже прописано Sitemap: http://www.frozzen.name/sitemap.xml.gz (писалось намного раньше - для Гугла), что тогда лучше сделать?
Удалить текущий сайт и добавить с www?
Неактивен
froZZen написал:
В Яндексе действительно без www.
А если в роботе.тхт уже прописано Sitemap: http://www.frozzen.name/sitemap.xml.gz (писалось намного раньше - для Гугла), что тогда лучше сделать?
Удалить текущий сайт и добавить с www?
просто удалить и по новой добавить с www
Отредактированно sbel (23-01-2010 16:30:36)
Неактивен