<p>Не первый раз в Яндекс Вебмастере сообщается об ошибке карты сайта (sitemap), связанной с расширением .gz. Так и пишут, что на сайте обнаружена ошибка – как только Яндекс найдет, какие карты сайта надо индексировать.</p>
<p>Наконец, решил обратить внимание на эту проблему и [решительно] от нее избавиться на своих сайтах! Не вникая в подробности, сделал следующее: указал яндекс-ботам (да и всем остальным), что карту сайта sitemap.xml.gz не нужно учитывать, потому что ее в действительности не существует.</p>
<p><strong>Ошибка с картой сайта sitemap.xml.gz </strong></p>
<p>Вот примерное содержание письма в Яндекс Вебмастере:</p>
<p><img src="https://img-fotki.yandex.ru/get/198017/226655839.11/0_288c4f_9d3c3c17_XL.jpg" /></p>
<p>«На сайте … обнаружены ошибки в файлах Sitemap. <strong>Робот обнаружил ошибки в одном или нескольких файлах Sitemap сайта …</strong> Это может негативно повлиять на обход сайта. Проверьте файлы Sitemap. Перейдите в раздел диагностики, чтобы узнать обо всех известных Яндексу проблемах сайта».</p>
<p>Нажимаем на «Проверьте» и видим страницу с используемыми файлами Sitemap:</p>
<p><img src="https://img-fotki.yandex.ru/get/57422/226655839.11/0_288c51_a1f426d2_XL.jpg" /></p>
<p>В самом низу указан файл, который и вызывает ошибку:</p>
<p><img src="https://img-fotki.yandex.ru/get/57422/226655839.11/0_288c53_24eaad32_XL.jpg" /></p>
<p>Обращаем внимание, что этот файл находится в блоке «Найдены в robots.txt».</p>
<p>Если нажать на ссылку «1 ошибка», то можно увидеть ее подробности: «Неправильный адрес страницы» (404 Not found).</p>
<p><img src="https://img-fotki.yandex.ru/get/52656/226655839.11/0_288c55_2ce04386_XL.jpg" /></p>
<p>Попробуем перейти по адресу этого файла в браузере – файл sitemap.xml.gz действительно отсутствует.</p>
<p><img src="https://img-fotki.yandex.ru/get/55231/226655839.11/0_288c57_eb789154_XL.jpg" /></p>
<p>Этот файл якобы создает плагин, которым я пользуюсь для создания карты сайта – Google XML Sitemap (Настройки &gt; XML-Sitemap). Его установили более миллиона раз, но последнее обновление было 8 месяцев назад, да и автор Arne Brachhold давно перестал отвечать на жалобные вопросы пользователей на сайте WordPress.</p>
<p><img src="https://img-fotki.yandex.ru/get/195419/226655839.11/0_288c58_8bc2c995_XL.jpg" /></p>
<p>Есть, конечно, и другие подобные плагины. Например, по запросу XML Sitemap в панели управления (добавления) плагинов можно увидеть XML Sitemap &amp; Google News feeds от автора RavanH и некоторые другие, если нас интересуют часто устанавливаемые и недавно обновленные.</p>
<p><img src="https://img-fotki.yandex.ru/get/166616/226655839.11/0_288c59_dacb4af3_XL.jpg" /></p>
<p>Но проблема в том, что Яндекс будет всё равно искать несуществующий файл карты сайта с расширением .gz. Поэтому надо уничтожить любые упоминания о нем!</p>
<p><img src="https://img-fotki.yandex.ru/get/46310/226655839.11/0_288c5a_8be632bf_XL.jpg" /></p>
<p>Убедимся, что он есть в файле robots.txt: это можно сделать в самом Яндекс Вебмастере, если перейти в меню к «Инструментам» &gt; Анализ robots.txt.</p>
<p><img src="https://img-fotki.yandex.ru/get/194492/226655839.11/0_288c5c_2de674db_XL.jpg" /></p>
<p>Вижу, что у меня в нижней строке указан этот устаревший формат карты сайта, который не создается плагином давным-давно, вызывая ошибку 404 («не найдено»).</p>
<p>Поэтому удалю эту строку – но не в Яндекс Вебмастере, конечно, а в самом файле robots.txt на хостинге сайта. После этого Яндекс не будет искать несуществующий файл sitemap.</p>
<p><img src="https://img-fotki.yandex.ru/get/99562/226655839.11/0_288c5d_5d3ff1a0_XL.jpg" /></p>
<p>В конце можно еще раз пойти в Инструменты Вебмастера и проверить robots.txt – нажать черную стрелочку рядом с названием сайта. Должен загрузиться новый файл, который можно проверить, нажав желтую кнопку «Проверить».</p>
<p><img src="https://img-fotki.yandex.ru/get/195990/226655839.11/0_288c5f_9427c7a_XL.jpg" /></p>
" data-medium-file="" data-large-file="" class="alignnone size-full wp-image-1439" src="http://oleksite.ru/wp-content/uploads/2013/06/e45c7e7d5a1ffd66799c9c0b0770ba9a.jpg" alt="Перенаправление со страницы входа (wp login) на Яндекс" width="300" height="200" srcset="http://oleksite.ru/wp-content/uploads/2013/06/e45c7e7d5a1ffd66799c9c0b0770ba9a.jpg 300w, http://blogmann.ru/wp-content/uploads/2014/09/redirect-from-login-page-to-another-website-50x33.jpg 50w" sizes="(max-width: 300px) 100vw, 300px" title="Перенаправление со страницы входа (wp login) на Яндекс" />

Это интересно:  Нужно ли размещать видео на сайте для продвижения и SEO

Меня немного напрягают хакеры: старая история на новый лад – после выставления хорошего сайта на продажу на Telderi начинаются подборы пароля. Но в этот раз искатели легкой наживы перешли все границы, атакуя по тысяче раз за полчаса.

Плагин iThemes Security (aka Better WP Security) блокирует попытки подбора паролей и «прячет» служебные страницы админки и авторизации, но нагрузка на хостинг никуда не девается. Если вчера процессор напрягся до 180%, пока я не заметил атаку, то сегодня нагрузка достигла 390%!

Попробовал еще один способ, не знаю, что получится. Сделал перенаправление в файле .htaccess со стандартного адреса /wp-login совсем на другой сайт (на Яндекс, в данном случае).

О том, как бороться с ботами, плагин предлагает почитать эту статью. Там действительно всё расписано подробно и в комментариях хвалят, но приведенный автором список as is не работает, выдавая на сайте 500-ю ошибку. Не стал разбираться пока…

Апдейт: добавил еще перенаправление для страницы /wp-admin. Она вообще ведет на сайт, где посылают на три веселых буквы.

См. результат (апдейт от 15.11.14): Падение посещений с Яндекса после перенаправления

---------------------

Не получилось установить нормально игру «Симс 4», поэтому пока наслаждаемся только красивым обзором этой игры.

Видео. Обзор игры The Sims 4

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.

Самое интересное в блоге

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

четыре + 10 =