
Дубли страниц это когда одна страница имеет несколько url адресов, например:
- https://www.econdude.pw/2017/06/bitkoin
- https://www.econdude.pw/2017/06/bitkoin?m=1
- https://www.econdude.pw/2017/06/bitkoin?comments_23132
Как определить есть-ли у вас дубли страниц на сайте?
Там вы увидите какие страницы гугл считает дублями. В моём случае это были ?m=0
Как починить дубли страниц в блоггер (blogger)?
Говорю сразу, всё что пишется вот тут - это для своих кастомных доменов второго уровня в blogger. Стандартные домены и стандартные шаблоны не должны иметь таких проблем, но если у вас стандартный домен типа "myblog.blogspot.com" - то тут будет отдельная головная боль и я не знаю как её решать, так-как там будет:
myblog.blogspot.com, myblog.blogspot.ru, myblog.blogspot.ua
Добавление канонического тега в данном случае вам может всё сломать. В случае если у вас такой бесплатный домен третьего уровня, там всё должно быть нормально и у вас в шаблоне должно быть "<b:include data='blog' name='all-head-content'/>" вот такое, а проблема с дублями возникать не должна. Если всё-таки возникает, то тут уже не помогу.
Про это я читал только в англоязычных блогах и там какой-то очень сложный фикс.
Советую вам тогда просто установить новый чистый современный blogger шаблон и всё, должно помочь.
Но если у вас свой blogger домен и есть дубли страниц, читайте дальше.
Сделайте копию вашего html шаблона. Затем ищите вот этот код:
<b:include data='blog' name='all-head-content'/>
Если у вас его нет (хотя он должен быть и есть в новых шаблонах), тогда нам нужно добавить канонические ссылки. Сказать Яндексу и Гуглу какие ссылки считать каноническими.
Данный код сверху по идее должен это сделать, если-бы он у вас был всегда и изначально, он много что делает, но если у вас есть дубли, а этого когда нет, его добавление вам не поможет.
У вас не должно быть одновременно кода сверху и кода снизу! Тогда будет два сигнала о канонических ссылках и это просто проигнорируется. Добавляйте код снизу если кода "<b:include data='blog' name='all-head-content'/>" у вас нет.
Нам нужно до </head> добавить следующий код:
<!-- canonical links -->
<link expr:href='data:blog.url.canonical' rel='canonical'/>
<!-- canonical links -->
Таким образом вначале мы сообщаем что все data:blog.url (ссылки) являются каноническими. Затем нам нужно найти все "data:blog.url" в коде и добить туда .canonical
Таким образом мы заставим блоггер считать все ссылки с https каноническими, однако далее могут возникнуть проблемы с RSS и некоторые другие, так-как blogger пока всё таки слабо поддерживает HTTPS для кастомных доменов.
Когда вы добавите канонические ссылки, нужно подождать 20-30 дней до следующей переиндексации.
Как проверить устранение ошибки?
Если я тестирую мобильную страницу, мне выдаёт канонической ссылку http, а не https. Тут уж я опускаю руки, но это вообще-то плохо, хотя как вы видите в мобильной выдаче он в виде канонической не выдал "?m=1".
Вот именно поэтому переезжать на HTTPS для блогер может быть рановато. Сейчас он может понять что у меня есть еще и страницы http и сделать новые дубли.
Однако для себя я нашёл фикс! Я просто отключил мобильный вариант сайта:
При этом если я зайду с телефона в мой блог, то он меня всё ровно перенаправит на адрес "?m=1", однако там канонические ссылки будут уже как и в версии рабочего стола.
Не советую убирать мобильную версию вашего сайта и как видите если-бы не https, проблемы-бы не было, тем не менее в моём случае, когда в блоге нет сайтбара (и например в случае сайта "шпаргалка блогера"), можно убрать отдельную версию для мобильных телефонов, она не так плохо смотрится и понимает такие штуки как оценка постов и комменты, а мобильная версия их не всегда понимает.
Правда в таком случае возникает вопрос, а зачем вообще тогда перенаправлять людей на ?m=1, однако это вшито в blogger намертво и как это убрать я не нашёл.
А что с Янедксом?
Яндекс в данном случае даже умнее гугла и он сам периодически выкидывает дубли из индекса, Яндекс так-же понимает канонические ссылки так что прописал их, он всё сам уберёт. Склеить http и https у него просто, там отдельная процедура и специальная функция.
Склеивание сайта с www и без www в blogger
Дубли бывают не только с мобильными страницами, но и с www. Для избежания этого нужно сделать редирект на www вот тут:
А так-же в Google Search Console указать основной адрес:
Еще можно попробовать указать "host" для Яндекс, как это например указано ниже на примере файла robots.txt у "Шпаргалка Блогера". Хотя blogger и не поддерживает "host", но вроде как Яндекс и без этого понимает где главный адрес.
Альтернативный способ решения проблемы через robots.txt
Есть еще несколько способов решить проблему дублей страниц.
Первый, это закрыть в robots.txt от индексации все "?m=0" и "?m=1".
Например Азбука Блогера в файле robots.txt имеет:
Это значит что изначально от индексации закрыты все мобильные страницы. Не могу точно сказать что это верное решение, тут нужно изучить вопрос, но такой метод довольно хорошо защитит от появления дублей.
Часто в качестве эталона я смотрю на сайт "Шпаргалка Блогера", там robots.txt вот такие:
При этом там вообще нет отдельной версии сайта для мобильных устройств.
Я думаю что закрытие от индексации "m" это радикальный метод, но он может работать. Вот только если страницы уже в индексе, то это не поможет.
Если страницы уже в индексе, то можно либо их удалить руками (Яндекс Вебмастер, Google Search Console), либо ждать когда поисковики их сами склеят.
Проблема даже в факте наличия таких адресов в индексе, а в том, что поисковики понимают их как разные страницы. После добавления канонических ссылок даже если у вас осталось в индексе куча страниц типа "?m=0", поисковики сами поймут что это не дубли, и полностью передадут вес на основную страницу.
Еще один способ починить дубли страниц
Другой способ, это в Google Search Console найти параметры URL:
И сделать всё следующим образом:
Тут мы сообщим гуглу что все ссылки где есть "m" разбивают на страницы и это плохо. А так-же скажем что далее пусть робот Googlebot сам решает что с этим делать. Мы просто обозначим ему проблему.
Это как вариант решения, однако я его не тестировал (нужно в любом случае ждать 20-30 дней), но если канонические у вас не сработают, как я написал ранее, попробуйте вот это.
Вообще, можно просто тут указать "Никакие URL", тогда он все "?m" ссылки выкинет из индекса, но это может быть опасно и так лучше не делать.
В любом случае помните, что эту проблему нужно решить, она может быть той самой причиной по которой вы не получаете нормальный трафик и получаете низкие позиции, однако не спешите и не переживайте. Если один метод не сработал, попробуйте другой, а так-же спросите на форуме Google / Blogger, там вам могут подсказать.
Кроме того, специально под эту гостевую статью, я сделал видео на своём ютуб канале где рассказал и показал как можно починить дубли страниц в blogger. Видео приватное (доступно только по ссылке и от сюда) 17 минут, можете посмотреть.
А так-же можете посмотреть другие видео на моём канале про продвижение и раскрутку. Их не очень много, но они есть и могут быть вам полезны.
Моя вторая гостевая статья в этом блоге. Рад если вам она окажется полезной 🙂
Я буду периодически заглядывать в комменты и отвечать на вопросы по возможности.
Извините вопрос не по теме.
У меня сайт site.blogspot.com.
Какой сайт лучше добавить в Search Console для верификации.
site.blogspot.ru или site.blogspot.com.
Может оба сразу.
В Яндексе site.blogspot.ru прописал. Без проблем.
Владимир, если вы в России, то лучше прописать доменную зону ru
Иногда на этом сайте попадаются статьи, у которых не отображаются картинки.