Сергей ЛЮДКЕВИЧ WebEffector: Факторы ранжирования Яндекса. CyberMarketing 2010

15:30 – 16:30 Сергей Людкевич Сергей
ЛЮДКЕВИЧ

Начальник отдела аналитики WebEffector
Тема доклада: “Факторы ранжирования Яндекса”

Реалии МатриксНета – сейчас нет одного или нескольких факторов, “прокачав” которые, можно добиться хорошего результата в ранжировании. Необходима комплексная работа “по всем фронтам”


По заявлениям сотрудников Яндекса на весну 2010 насчитывалось 420+ факторов ранжирования


Аналитическая служба сервиса WEbEffector проводит постоянные исследования факторов ранжирования


Виды факторов
1. Внутренние
2. Внешние
3. Поведенческие


По результатам наших исследований данные три агрегированные группы факторов имеет примерно одинаковые пропорции по вкладу в релевантность – 30-35% каждая


Внутренние факторы
1. Текстовые
2. Региональные
3. Свойства документа и сайта
4. Антиспамовые


Внешние
1. Ссылочные динамические
2. Ссылочные статические


При исследовании ссылочных динамических факторов замечена некая характеристика донора, влияющая на значение факторов. Мы её называем по старой доброй традиции “непот”. Донор, не находящийся по “непотом” даёт существенный вклад в ряд ссылочных динамических факторов, наоборот, вклад донора “под непотом” в эти факторы – нулевой или мизерный (в зависимости от фактора). Мы умеем определять эту величину для данного донора по сложной методике. Результаты проверок используются при составлении “вайт-листов” доноров с в системе WebEffector


Поведенческие
1. Посещаемость
2. Кликабельность в результатах поиска
3. Поведение пользователя на сайте


Разработана методика, позволяющая оценить качество поведенческих факторов по конкретному запросу для конкретного документа


В начале доклада Сергей пообещал не писать формулы :)

Сергей подразделяет факторы ранжирования на 3 группы:
- Пользовательские факторы
- Внешние факторы
- Внутренние факторы

Формулы ранжирования отличаются между запросами в зависимости от их популярности.

Внутренние факторы подразделяются на
- Тексты
- Качество сайта (его спамность: наличие попандеров и кликандеров)
- Естественность текста
- Уникальность текста

Текстовые факторы в свою очередь Сергей подразделяет на
- Доменное имя
- Адрес страницы
- Текст документа
- Тег тайтл
- Элементы оформления текста (Я так понимаю, речь о STRONG, B т.п)

Сергей также упомянул, что по его ощущениям, даже если часть запроса в доменном имени.

При ранжировании документов применяется функция BM 25.

Свойства документа
- Возраст домена не играет роли, имеет значение дата непрерывной индексации. В этом случае, если сайт по каким-то причинам выпадает из индекса на долгий период, то после его возвращения в индекс значение возраста обнуляется. На вопрос Константина Симакова: является этот параметр бинарным или непрерывный. Сергей пояснил, что параметр, безусловно, непрерывный (т.е. чем старее сайт, тем выше он ранжируется), но, вероятно, по достижению определенного значения (например после 5 или 7 лет) параметр не меняется, достигнув максимального значения
- HTML в целом документы ранжируются лучше
- Документы на русском языке ранжируются выше для запросов на русском языке
- Доменная зона рекомендуется .ru, на вопрос из зала – можно ли регистрировать .su и .рф Сергей однозначного ответа не дал, но сказал, что не рекомендует
- Важность сайта (пример – википедия, либ.ру, я думаю, что этот параметр выставляется вручную)
- При регистрации сайта в Я.каталоге модераторы могут повысить авторитетность сайта, также при регистрации определяется тематичность сайта
- Чем больше страниц на сайте, тем хуже
- Порнографичность контента

Ссылочные факторы
- тИЦ, PR
- Общее количество ссылок на документ

Динамические факторы
- Региональность ссылки (один и тот же регион у донора и сайта)
- Тематичность (однако Сергей упомянул, что сильного влияния он не заметил)
- “Продажность” ссылок: для некоммерческих запросов подобные ссылки практически не работают
- Возраст ссылки (молодые ссылки учитываются хуже)

Яндекс делит ссылки на хорошие и плохие ссылки. Хорошие ссылки могут иметь различный коэффициент полезности, плохие могут оказывать отрицательное влияние.

Новые ссылки не дают никакого вклада первые три недели.

Пользовательские факторы

- Посещаемость ресурса влияет на ранжирование
- Кликабельность документа в выдаче тоже влияет
- Поведение пользователей на сайте

Яндекс.бар забирает очень много информации (я предполагаю, что Сергей имел ввиду, что таким образом Яндекс анализирует, как вели себя пользователи на сайте).

Существуют различные алгоритмы ранжирования для следующих групп регионов:
- Москва
- Питер, Екатеринбург и другие крупные города (всего 16)
- Общероссийская выдача и др. города России (последнее изменение ранжирования коснулось только этой группы)

Метки: , ,

5 коммент. к записи “Сергей ЛЮДКЕВИЧ WebEffector: Факторы ранжирования Яндекса. CyberMarketing 2010”

  1. Андрей пишет:

    - Чем больше страниц на сайте, тем хуже

    –имеется ввиду что чем больше дублированных страниц? Или все же тут опечатка, на самом деле лучше. Почему это будет хуже, если на сайте больше качественного, не дублированного контента…

  2. Б пишет:

    спасибо за краткое содержание.

  3. ratak пишет:

    - Чем больше страниц на сайте, тем хуже
    Для меня это тоже непонятно, всетаки скорее всего опечатка.

  4. admin пишет:

    Нет, всё верно

Прокомментировать