Содержание
Сергей Людкевич рассказал о новых критериях и принципах ранжирования сайтов в поисковой выдаче Яндекса.
- Принципы построения формулы ранжирования (машинное обучение).
- Наличие нескольких формул ранжирования в Яндексе под различные типы поисковых запросов.
- Анализ выдачи, выявление значимых факторов и примесей.
- Запросные факторы, анализ запроса в ПС, выбор формулы, Спектр.
Машинное обучение
- Совокупность оценок: запрос-документ-регион.
- Множество посчитанных признаков (запроса, документа, сайта, ссылок, поведения, региона, антиспам) — совокупность факторов.
- Выбор метрик (их максимизация/минимизация).
- Настройка формулы.
- Что требуется для построения ранжирования.
Зачем строить формулу. Формула или ручная разметка
- Десятки миллионов запросов ежедневно! Порядка 25% из них — уникальные!
- Требуется большая и контрастная обучающая выборка.
- Далее формула «экстраполируется».
- Есть проблемы: переобучение, здравый смысл. Как быть с логикой? Делать ли ограничения для формулы? Нужно ли много признаков?
Различные формулы ранжирования
- Существование различных формул ранжирования.
- Формулы для различных стран.
- Региональные формулы ранжирования (внутри страны).
- Специализированные формулы для классов запросов: скачка/игры/видео.
- Коммерческая формула для Московского региона.
- Можно ли выявить, что используется другая формула?
- Смысл существования нескольких формул?
ТОПовые факторы
- Существование наиболее значимых факторов.
- Всего в формуле участвует более 700 факторов (по разным оценкам).
- Могут «рулить» разные факторы по разным запросам.
- Можно ли выделить ТОПовые из общего списка и какие они?
- Если ли смысл в анализе ТОП-10 для поиска этих факторов?
- Какие сайты из ТОП-10 лучше отбрасывать при таком анализе?
- Существует ли возможность воздействия на ТОПовые факторы (или они не являются «SEOшными»)?
Анализ выдачи: примеси
- Выявление примесей в ТОП-10 выдачи по запросу.
- Методика отсечения Спектра.
- Методика отсечения новостных результатов.
- Колдунщики.
- Трастовые ресурсы.
Когда и что подмешивать в выдачу?
- Базовый анализ поискового запроса: Частотность, кол-во слов в запросе, коммерция, время задания запроса, поиск организации, ФИО, прочее характеристики запроса определение тематики и языка поиск слов-маркеров.
- Нужно ли запускать другие вертикальные поиски: фото, карты, видео, блоги, перевод и другие расширение запроса и ограничения.
Модификации органической выдачи
В органические результаты выдачи подмешиваются:
- Спектр.
- Новостные результаты (быстроробот).
- Колдунщики по сервисам и вертикальным поискам.
- Мобильные приложения.
- Сейчас ещё персонализация.
- Не за горами Острова…
Фильтры: постфильтры
Итоговое значение функции релевантности может:
- Штрафоваться (постфильтры) за текстовую переоптимизацию (два различных фильтра).
- Штрафоваться за манипулирование ссылочными факторами, избыточное количество «плохих» ссылок.
- Может применяться склеивание/скрытие результатов (одинаковые сниппеты и аффилированние).
- Санкции на закрутку поведенческих факторов.
Поиск и выявление фильтров
Имеется ли возможность выявления наложения фильтра?
- Специализированные запросы в поисковую систему.
- Секретные поисковые операторы.
- Расширенный поиск.
- Дырки в алгоритме и защите.