♛ FORTRESS-DESIGN

Новый алгоритм определения текстового спама Баден-Баден

Содержание

Помогая пользователям находить ответы на вопросы и решать разнообразные задачи, Яндекс старается показывать в результатах поиска те сайты, которые лучше справляются с этой задачей – то есть являются более удобными и информативными. Удобство и информативность сайта во многом зависит от текста, который пользователь видит на его страницах.

К сожалению, довольно часто тексты на страницах сайтов пишутся не для людей, а для поисковых роботов.

В них много повторяющихся ключевых слов и неестественных речевых оборотов, но мало полезной информации. Яндекс называет такие тексты переоптимизированными и старается, чтобы страницы с такими текстами не ранжировались высоко в результатах поиска, отдавая предпочтение текстам, написанным для людей.

Новый алгоритм определения переоптимизированных страниц

23 марта Яндекс анонсировал внедрение нового алгоритма «Баден-Баден», который выявляет на сайтах переоптимизированные тексты. Соответственно в продакшене с 22 марта. Такие тексты создаются с целью повлиять на позиции сайта в поисковой выдаче: обычно в них много ключевых слов, но мало полезной информации.

Просто оптимизированные, но не несущие реальной ценности тексты, перестают работать. Со временем выдача будет строиться независимо от количества вхождений, тошноты и уровня плотности ключевых слов.

Баден-Баден уже начали использовать в ранжировании. В апреле 2017 года Яндекс переходит к следующему этапу работы с этим алгоритмом — начинает использовать его для определения на сайте нарушения «Переоптимизация», при наличии которого все страницы сайта могут ранжироваться ниже.

Информация о наличии этого и других нарушений поисковой лицензии отображается в Яндекс.Вебмастере в разделе «Диагностика» → «Безопасность и нарушения». Но какая конкретно страница попала под ББ, указано не будет.

Анонс Яндекса

SEO-текст – обязательный компонент поискового продвижения сайта. Такие тексты издревле используются на Руси для SEO, поискового продвижения, поисковой оптимизации и раскрутки сайта. Задаетесь вопросом, как написать SEO-текст недорого? SEO-текст написать очень просто – достаточно обратиться к специалисту по написанию SEO-текстов в Москве, Санкт-Петербурге и других городах России. Текст SEO, написать который у вас возникла необходимость, должен обладать двумя важными свойствами – это должен быть текст и он должен быть SEO

Такие тексты можно встретить на страницах сайтов, предлагающих различные товары и услуги. Мы не уверены, что такие тексты пишут люди, но совершенно очевидно, что пишутся они не для людей, а для поисковых алгоритмов.

На самом деле поисковым алгоритмам Яндекса такие тексты тоже не очень нравятся. А теперь будут нравиться еще меньше – мы переработали и существенно улучшили алгоритм, определяющий переоптимизированные страницы. Он является частью общего алгоритма ранжирования, результатом его работы может стать ухудшение позиций переоптимизированных страниц в результатах поиска.

Рекомендуем вебмастерам перечитать страницы сайтов и отказаться от бессмысленных и беспощадных текстов, чтобы не было мучительно больно.

По понятным причинам мы назвали наш новый алгоритм определения текстового спама Баден-Баден.

Пока-пока
Команда Поиска

Немного истории

Бороться с переоптимизированными текстами в явном виде Яндекс начал с фильтра «Переспам» (портяночный, «-20»), хотя официально его не анонсировал.

Как сказал Денис Расковалов (ex основной разработчик Яндекса, в настоящее время работает в поисковой системе Bing):

«Ну, я, конечно, не дизайнер, но, по-моему, большие тексты на главной странице — смотрятся некрасиво».

А дальше было много всего, что связано с текстами

Уже сейчас можно сказать, что:

Аналитика от SeoPult

Действительно, последние недели многие наблюдают значительные колебания позиций сайтов практически во всех тематиках, что обычно является предвестником изменений алгоритмов. Аналитики SeoPult проанализировали изменения в выдаче и наложили данные на заявление Яндекса. Пока не приходится говорить о том, что достигнуты заявленные представителями Яндекса цели. Более того, они заметили большое количество ситуаций, где выдача существенно ухудшилась как раз с точки зрения текстового фактора, что говорит о неминуемой дальнейшей настройке алгоритма. Давайте разберемся подробнее.

Занижение позиций переоптимизированных с точки зрения поисковой системы страниц должно было бы избавить верхние строчки выдачи от:

Беглый анализ поисковой выдачи позволяет увидеть, что эти цели, мягко говоря, не были достигнуты. Так как в выдаче присутствуют коммерческие сайты с большим вхождением ключей.

Новый алгоритм «Яндекса» не считает подобные страницы переоптимизированными, что маловероятно, либо алгоритм пока не дошел до стадии качественной обработки подобных ситуаций.

Также можно рассмотреть выдачу по низкочастотным запросам и встретить тексты с  формулировками, которые нарушают нормы русского языка. В нижней части страницы находится большой текст, содержащий как 44 вхождения ключевого слова, так и классический пример использования сложной SEO-фразы в текстe: «очки для зрения купить интернет-магазин предлагает недорого».

Подобные примеры не единичны и находятся практически в каждой тематике. Писать подобные тексты и размещать их на своих сайтах не стоит. С большой долей вероятности в будущем позиции подобных страниц будут понижены в поиске как в Яндексе так и в Google. Пишите тексты для продвижения вашего бизнеса, ориентируясь на посетителей вашего сайта. Главная задача любого текста — продать посетителям товары или услуги, которые вы продвигаете.

Исследование алгоритма «Баден-Баден»

Из специального выпуска SeoPult

Сегодня оптимизированный текст на сайте далеко не всегда помогает значительно улучшить вашу поисковую видимость. В случае переоптимизированности контента есть риск получить санкции для всего сайта. Узнать о том, как работает новый алгоритм и его последствиях, а также получить рекомендации по выходу из-под санкций вы сможете в нашем исследовании.

В связи с новым алгоритм «Баден-Баден» потребность в качественном оптимизированном контенте для сайтов возросла еще больше.

Технологии поискового маркетинга

Рис. 1 Пример уведомления о наложении фильтра в панель Яндекс Вебмастер.

Сразу после выхода нового алгоритма мы провели его предварительный анализ. На тот момент алгоритм находился на стадии калибровки. Сейчас алгоритм устоялся и его можно подвергнуть всестороннему изучению, тем более что поисковая система «Яндекс» начала рассылать уведомления о наложении фильтра в панель «Яндекс.Вебмастера».

В исследовании детальному рассмотрению подвергнут фильтр «Баден-Баден». Были изучены:

Были проверены гипотезы о том, что фильтр накладывается на:

Исходные данные

Для исследования были взяты сайты, которые продвигаются в системе SeoPult и получили уведомление о наложении фильтра «Баден-Баден» в панели «Яндекс.Вебмастера». Таких сайтов оказалось 117.

Выявляем страницы, попавшие под фильтр

Фильтр «Баден-Баден» может накладываться не только на конкретную страницу, но и на весь сайт (такое действие алгоритма было замечено при большой доле проблемных страниц на сайте). Для корректности исследования из него нужно было исключить не попавшие под фильтр страницы сайта и изучить остальные. Такие страницы имеют достаточно характерный признак: они просели на 6–30 позиций по продвигаемым словам и потеряли в трафике из поисковой системы. До 5 апреля фильтр накладывался только на страницы, поэтому мы сравнили позиции до начала выкатки алгоритма 1 марта с позициями, когда фильтр уже устоялся, но ещё не начал накладываться на весь сайт. Напомним, что анонс алгоритма состоялся 23 марта, но перед этим уже были существенные изменения позиций. Разумеется, пришлось исключить и выпадения из топа по иным причинам, например, сайты, вовремя не оплатившие хостинг и пр.

Просевших страниц после отбора оказалось 434. Для анализа зафильтрованных страниц мы взяли релевантные, по мнению «Яндекса», страницы (копия базы от 1 марта). Это связано с тем, что при наложении фильтра «Баден-Баден» изначально релевантная страница зачастую меняется на другую, так как пессимизированная страница достаточно сильно теряет в релевантности.

Сравниваем пессимизированные и страницы из топа

Дальнейшее исследование будет построено на сравнении пессимизированных страниц со страницами, находящимися в топ-10.

Параметры сравнивались автоматически и с помощью асессоров. Асессору давалось 10 страниц (9 из топ-10 и одна пессимизированная), высказывалась гипотеза и предлагалось определить, какая из страниц по данной гипотезе находится под фильтром. При таком анализе вероятность случайно угадать — 10%. Рабочая группа состояла из 30 человек. Для повышения точности каждая гипотеза проверялась одним и тем же асессором на разных страницах по 5 раз.

Начинаем проверку обозначенных гипотез

Для этого в режиме эксперимента в автоматическом режиме оценивался % расхождения с сайтами, находящимися в ТОПе, а далее асессоры проводили визуальную оценку пессимизированной страницы.

Эксперимент №1: Страницы с большими простынями текстов

Автоматическая проверка показала, что на пессимизированных страницах объём текста на 27% больше, чем на страницах в топе.

Асессоры при визуальной оценке определяют пессимизированную страницу с вероятностью 54%.

Рис. 2 Пример страницы с простыней текста

Вывод: судя по статистике, большой размер текста является ярко выраженным признаком. Можно предположить, что большие тексты чаще вызывают пессимизацию, однако есть нюансы — все зависит от поискового запроса.

Мнение экспертов:

  • «Я полагаю, что тут проблема даже не в самом объеме контента, а в его полезности. Очень сложно написать большой и полезный текст. Скорее всего, у вас получится большой „водянистый“ текст, а пользователи ценят содержательность и краткость».— Алексей Штарев, исполнительный директор SeoPult
  • «Основная проблема больших текстов — это их нечитабельность. Даже если текст очень полезный и содержательный, но оформлен простынёй, то его никто читать не будет. Поисковые системы это прекрасно понимают, и чтобы не пугать своих пользователей такими текстами, они пессимизируют страницы. Чтобы текст начали читать, необходимо переверстать контент блоками, добавить заголовки, картинки, списки с перечислениями, таблицы, видео, прикрепить файлы для скачивания (при необходимости). Важно соблюсти баланс отступов, интервалов, размера и цвета шрифтов — делайте тексты для людей, а не для поисковых роботов».— Игорь Коновальчук, руководитель отдела наполнения сайтов, SeoPult

Рекомендации: Если вы получили сообщение в «Яндекс.Вебмастере» о наложении фильтра «Баден-Баден», необходимо произвести анализ объема текста, сравнить его с объемом текста у конкурентов и сократить тексты на пессимизированных страницах. Уменьшать можно ступеньками по 10%, дожидаясь переиндексации. Не помогло — уменьшайте ещё на 10%, и так до снятия санкций. Избавляйтесь от самых малоинформативных слов, предложений и абзацев. Если боитесь ухудшения позиций в Google, можете использовать тег noindex, закрывая «водянистые» куски текста в него.

Эксперимент №2: Текст на странице расположен ниже первого видимого экрана

Автоматическая проверка не проводилась, ввиду сложности и крайне низкой точности. Асессоры при визуальной оценке определяют пессимизированную страницу с вероятностью 51%.

Рис. 3 Пример страницы с простыней текста ниже списка товаров

Вывод: судя по статистике, это тоже ярко выраженный признак. Можно также сделать еще один предварительный вывод: текст, размещенный в подвале, — повод для пессимизации в ряде случаев.

Мнение экспертов:

  • «Такая проблема встречается не только на главной и страницах товарных категорий, но и на карточках товаров. На первом экране карточки товара видны название, фото, цена и кнопка „Купить“, а ниже расположен оптимизированный текст. Чтобы не попасть под фильтр, текст должен быть чётко структурирован и полезен пользователю».— Игорь Коновальчук, руководитель отдела наполнения сайтов, SeoPult

Рекомендации: Разместите текст на видимой части экрана. Не заставляйте посетителя долго прокручивать экран вниз для получения важной информации о товаре или услуге.

Эксперимент №3: Текст со скрытыми областями

Автоматическая проверка проводилась только на использование на сайте display: none. Выявлено, что на пессимизированных страницах данный атрибут используется на 36% чаще, чем на страницах в топе.

Асессоры при визуальной оценке определяют пессимизированную страницу с вероятностью 61%.

Рис. 4 Пример страницы с визуальным скрытием текста под скролл

Вывод: признак явный. Несмотря на редкость использования display:none и огромное количество других возможностей верстки для скрытия читаемого контента, наличие display:none на странице — явная причина пессимизации. Асессоры также подтвердили эту гипотезу и без проблем находили блоки со скроллингом, спрятанные под кнопки, и пр. на пессимизированных страницах.

Мнение экспертов:

  • «Фокусы с узким блоком текста со скроллингом внутри, сокрытие текста под кнопку „Читайте подробнее“ могут привести к пессимизации. Переключающиеся вкладки с текстом можно использовать, если есть четкое дизайнерское объяснение, зачем это сделано. Однако риск все равно остается — все дело в текстах, которые показаны под этими блоками. Если это „SEO-текст“, вероятно, вас накажут».— Алексей Штарев, исполнительный директор SeoPult

Рекомендации: Убедитесь, что на сайте нет блоков, скрывающих тексты, или их решение оправданно с точки зрения удобства пользования сайтом.

Эксперимент №4: Страницы, содержащие множественные повторения прямых вхождений ключевых слов

Автоматическая проверка показала, что на пессимизированных страницах количество точных вхождений ключевого слова на 12% больше, чем на страницах в топе.

Асессоры при прочтении текста определяют пессимизированную страницу с вероятностью 16%.

Рис. 5 Пример страницы с избыточным содержанием ключевого слова

Вывод: судя по автоматической проверке, признак слабо выраженный. Скорее всего, из-за того, что поисковая система «Яндекс» и ранее боролась с подобной «оптимизацией», накладывая фильтры на подобные страницы. Вероятность определения асессорами небольшая по этой же причине: все тексты, находящиеся в топах (особенно в конкурентных нишах), содержат приблизительно равное количество точных вхождений ключевых слов.

Мнение экспертов:

  • «Зачастую владельцы сайта размещают мало ключевых слов на странице, но размещают их очень плотно, например, в первом абзаце. В результате вся страница может быть пессимизирована из-за одного абзаца. Анализировать текст на переспам нужно не только в совокупности, но и конкретно в разных частях: в заголовках H1, H2…, в Title, в абзацах текста, списках, метатегах и т. д.».— Игорь Коновальчук, руководитель отдела наполнения сайтов, SeoPult

Рекомендации: Пройтись по текстам и постараться убрать избыточное дублирование слов, которые бросаются в глаза. При расчёте требуемого количества вхождений нужно брать за ориентир плотность ключевых слов на страницах в текущем топ-10. С внедрением алгоритма эта плотность снизилась.

Поисковые роботы хорошо понимают синонимы. Они не являются точными формами слова, но сохраняют смысл текста. Лишние точные вхождения можно заменить синонимами — это поможет оптимизации.

Эксперимент №5: Форма ключевых слов в тексте нарушает нормы русского языка, есть орфографические и пунктуационные ошибки

Автоматическая проверка показала, что на пессимизированных страницах количество грамматических, орфографических и пунктуационных ошибок на 18% больше, чем на страницах в топе.

Асессоры при прочтении текста определяют пессимизированную страницу с вероятностью 48%.

Рис. 6 Пример страницы с SEO текстом

Вывод: судя по автоматической проверке, признак неявный. Однако асессоры выявили закономерность.

Мнение экспертов:

  • «Писать тексты с фразами вроде „Купить окна Москва недорого“ или „Продажа паркета Москва — это город, в котором множество магазинов продают паркет“ не стоит. Пожалейте своих посетителей, читающих эти тексты».— Алексей Штарев, исполнительный директор SeoPult
  • «Наличие орфографических и пунктуационных ошибок — большая проблема. Она очень хорошо заметна в низкоконкурентных тематиках и на региональных сайтах. Там ошибок в текстах намного больше чем, например, в московской выдаче. Некоторые веб-мастера для уникализации текста додумываются заменить русские буквы С, О, Р, А, Х латинскими, тем самым обрекая себя на санкции».— Игорь Коновальчук, руководитель отдела наполнения сайтов, SeoPult

Рекомендации: Провести вычитку текстов и устранить грамматические ошибки (нарушение синтаксических норм, согласования, управления и т. д.). Также проверьте орфографию и пунктуацию.

Что, если сайт попал под фильтр

Для диагностики фильтра необходимо зарегистрироваться в «Яндекс.Вебмастере». При наложении фильтра в него придет уведомление.

Если фильтр наложен на страницу, снять его довольно просто. Достаточно устранить проблему, и в следующем текстовом апдейте фильтр будет снят. Если фильтр наложен на весь сайт, необходимо устранить проблемы на всех пессимизированных страницах и желательно сообщить об этом через «Яндекс.Вебмастер». Исходя из информации в «Яндекс.Вебмастере», фильтр будет снят в течение месяца после устранения нарушений.

Подытожим, что нужно делать, если сайт попал под фильтр:

  • Уменьшить объём текста и улучшить его вёрстку.
  • Стараться размещать тексты на страницах как можно выше, сделать их расположение более удобным для пользователя.
  • Уменьшить количество точных вхождений ключевого слова, использовать синонимы.
  • Исправить все виды языковых ошибок.
  • Сделать текст полезным для посетителей сайта, выделиться на фоне конкурентов.

Обратите внимание на позиции зафильтрованных страниц в Google и долю трафика, которую дает эта поисковая система. Если она существенна, необходимо действовать с осторожностью, применяйте тег noindex, скрывая части контента от Яндекса.

Критерии фильтрации «Баден-Бадена» сейчас мягкие и они будут ужесточаться со временем.

Даже если ваш сайт никак не пострадал от фильтра, это не даёт гарантии, что в будущем такого не произойдёт. Огромное количество сайтов в Рунете наполнено низкокачественными текстами. Многие такие ресурсы пока не пострадали от фильтра. Но мы рекомендуем смотреть в будущее и критически отнестись к своим текстам уже сейчас, т. к. критерии фильтрации «Баден-Бадена» сейчас мягкие и они будут ужесточаться со временем.

Что делать если просели позиции

  • Проверьте ваш сайт и убедитесь, что тексты на нём написаны для людей, а не для роботов.
  • Для снятия санкций нужно переработать переоптимизированные тексты в соответствии с рекомендациями выше.
  • Позиции сайта должны восстановиться в течение 2–3 недель (по заявлению Яндекса), — после переиндексации сайта и апдейта выдачи.

Какие глобальные изменения при составлении ТЗ для текстов возможны

  1. Подход к тексту, когда количество вписанных в текст ключевых слов важнее самого текста и его содержания будет упразднен.
  2. Вырастает значение текстового контента с точки зрения удержания внимания аудитории и совершения тех или иных целевых действий (покупка товара или рекомендация перейти на другой сайт).
  3. Учитывая, что у Яндекса есть еще и алгоритм «Палех», рано или поздно уйдут инструменты по сбору и кластеризации семантики. Сначала уйдет кластеризация. Но когда-то исчезнет и сбор семантики, в ней просто не будет необходимости.

Подробнее о том: как составить ТЗ копирайтеру, чтобы статья попала в ТОП без ссылок и почему в текстах нужны LSI-фразы.

Как не попасть под фильтр Баден-Баден

  1. Пишите тексты для людей, а не для роботов!
  2. Сосредоточьтесь на информативности текстов. Постарайтесь всесторонне раскрыть тему, глядя на проблему с разных углов и точек зрения.
  3. Оставьте в прошлом понятие «плотность ключевых слов».
  4. Забудьте о стереотипных формулах, таких как «вхождение ключа n раз на 1000 знаков».
  5. Не следуйте правилам: чем больше прямых вхождений, тем лучше. Для создания релевантного текста одного-двух вхождений ключа может быть вполне достаточным. Если хотите поднять релевантность, дополните текст синонимами, словоформами и LSI-фразами.
  6. Расширяйте семантическое ядро сайта LSI-фразами,чтобы максимально разнообразить семантическое ядро. Так как текстовая релевантность определяется наличием LSI ключевых слов, которые относятся к тематике сайта. В этом вам помогут подсказки и рекомендации Яндекса и Google, правая колонка Яндекс.Вордстата и специальные сервисы.
  7. Пишите тексты простым языком, соблюдая нормы и правила русского языка, не усложняя их сложными языковыми конструкциями терминами.
  8. Используйте ключевые запросы только для поиска релевантных фраз.
  9. Не пренебрегайте удобством оформления и внешнего вида сайта, улучшайте юзабилити, так как это весомый фактор в ранжировании сайта. Именно структурирование текста и хорошая подача влияют на качество восприятия информации.
  10. Пересмотрите старые статьи, размещенные на сайте. Возможно, их стоит доработать или полностью переписать.
  11. Равномерно и естественно используйте ключи в статьях.
  12. Внимательно изучайте поисковую выдачу и ТОП по интересующим запросам.
  13. Анализируйте и корректируйте тексты на страницах вашего сайта, которые уже находятся в ТОПе.

Выводы

  • Конечно, на рынке сменится парадигма работы с интернет-контентом.
  • В текущей реализации алгоритм «Баден-Баден» пока далек от заявленных целей, в ближайшее время будет наблюдаться его настройка, и, соответственно, будут дальнейшие скачки позиций сайтов во многих тематиках.
  • Если позиции сайта в ближайшее время значительно поменяются, рекомендуем не спешить вносить изменения в контент, если до этого позиции вас устраивали. Велика вероятность корректировок и возврата предыдущих значений.
  • Баден-Баден будет выявлять и пессимизировать не сайт, а отдельные страницы.
  • При написании контента уделяйте максимальное внимание его полезности для посетителей сайта, а не SEO-параметрам. Подобная тактика будет актуальна при любых изменениях алгоритмов поисковиков.
  • Для качественных площадок Баден-Баден скорее добрый попутчик, так как эти проекты стабильно развиваются и не думают о санкциях поисковиков.
  • Будут развиваться те инструменты, которые приносят пользу аудитории, прежде всего. А то, что нужно людям, нужно и Яндексу. Это, пожалуй, самый главный тезис, который нужно постоянно держать в голове, когда вы планируете работу по повышению поисковой видимости сайта. И вся история развития SEO — это эволюция от поиска и эксплуатации дыр в сторону маркетинга: в сторону выявления и удовлетворения информационного спроса конкретной ЦА.

Помните, продвижение сайта — это комплексная работа над ним.

Что отвечает Платон в случае просадки трафика

Здравствуйте!

Ограничений к Вашему сайту не применяется. Я попробую прояснить, с чем может быть связано изменение позиций.

Во-первых, корректировки наших алгоритмов. Это постоянный, автоматический процесс, основанный на машинном обучении Матрикснет. При этих корректировках постоянно уменьшается или увеличивается учёт тех или иных факторов, и это, в свою очередь, может оказывать как незначительное, так и заметное влияние на позиции.

Во-вторых, сайт может проседать не только из-за подобных изменений алгоритма ранжирования, но и по естественным причинам:

  • обновление поисковой базы, из-за которой в индекс попадают одни страницы, и исчезают другие;
  • контент на сайтах меняется;
  • меняется релевантная страница с сайта и т.п.

В-третьих, работа других сайтов также не стоит на месте.

Поверьте, если бы на Вашем сайте были какие-либо проблемы, я не стал бы этого скрывать. Но в данной ситуации единственное, что я могу посоветовать Вам, — это продолжать развивать свой проект. О том, что именно учитывается при определении релевантности страницы и как лучше развивать сайт, можно прочитать тут.


Перейти к верхней панели