Типичные ошибки алгоритмов и специалистов в кластеризации

Согласны:

Кластеризация это SEO тренд последних лет.

Но почти нет материалов о практической части кластеризации.

Я расскажу о том, когда НЕ следует ждать хороших результатов кластеризации и что сделать, что бы добиться нужного результата.

Ошибки алгоритмов кластеризации

В отличие от описания алгоритмов кластеризации, ошибки касаются именно самого метода пересечений результатов в топе, а не способов кластеризации по топу.

Где кластеризация работает плохо

  1. Новые тренды — новый товар, событие, сезонный тренд
  2. Низкоконкурентные НЧ и микроНЧ запросы
  3. Региональные ГЕОзапросы по средним и узким тематикам

Основная причина плохой работы это неопредленный ТОП в самой поисковой системы ⇒ некорректные “спорные” кластеры и низкое качество кластеров.

Пример:

В ноябре 2016 года для информационного сайта кластеризовали ядро под следующий год.

Сравнили кластеры 2016 и 2017 года, в 2016 году кластеры состояли из большего количества запросов с хорошей смысловой связкой, а 2017 год состоял из маленьких групп, с дроблением по одному интенту,  при тех же входящих настройках.

Сравнение кластеров модных платьев 2016 и 2017

Что делать:

  1. Использовать прогнозирование кластеров. Для примера выше мы просто использовали кластеры 2016 года под 2017. Для новых товаров мы используем стандартный набор шаблонных ключей, актуальные для всех страниц. Для событий, ищем похожее событие и прогнозируем семантику. Для регионов используем МСК семантику.
  2. Использовать базы для сезонных трендов. С помощью баз получаем запросы прошлых лет и уже их кластеризуем.
  3. Вычищать ядро от НК НЧ и микроНЧ запросов перед кластеризацией.

1 поисковая фраза ≠ 1 кластер

Если посмотреть граф кластера и запроса в нем, как он связан с другими запросами. То увидим, что 1 запрос можно отнести к нескольким кластерам.

Пример кластера при hard кластеризации

Для чего это нужно знать

Если вы плохо поработали с входящим ядром и не подготовили его для кластеризации, то при сборе для коммерческого сайта, запросы могут попасть в информационные кластеры.

В результате те запросы, которые вы могли использовать, заберут на себя кластеры, которые на сайте вам не нужны.

Пример:

При сборе для интернет-магазина получили запрос «красные платья», который имеет 6 информационных результатов и 4 коммерческих.

Если с входящим ядром не проведена подготовительная работа, то этот запрос попадет в информационный кластер, когда мы могли его спокойно продвигать на странице раздела и занять один из 4 коммерческих результатов, а не один из 6 информационных.

Вывод: если вам нужен запрос в другой кластер, переносите его с оглядкой на топ.

Даже один похожий по контенту результат в топе дает шанс выйти в топ с нужным контентом.

1 страница ≠ 1 кластер

Кластер обычно оптимизируют под одну страницу. Но в действительно страницу можно оптимизировать под два и более кластеров, в ситуация, когда:

  1. Главная страница — как правило может ранжироватся по нескольким кластерам, даже с разными интентами, особенно если специализированных главных конкурентов под ваши кластеры мало
  2. Сильные страницы — особенно актуально в инфо тематиках, когда под широкий инфо запрос делается статья, цепляющая все связанные кластеры с основной темой
  3. Узкие страницы — когда топ неконкурентный и в топе слабые страницы, то узкоспециализированные страницы могут оптимизироваться под несколько связанных кластеров.

Проблема одного аргумента в кластеризации

У кластеризации завязанной на одном аргументе = количество пересекаемых результатов в топе, возникает проблема, когда для одной поисковой фразы количество пересекаемых результатов одинаковое для двух кластеров

Визуальный пример спорного запроса при Hard кластеризации

Ниже пример, когда одна фраза попала в меньший кластер, имея пересечения с двумя кластерами с одинаковым количеством связей

«Мебель для ресепшен» имеет пересечения с кластером выше

Что делать:

На автоматическом уровне решили фразу относить к большему кластеру по количеству фраз, а так же в последствие избавляться от зависимости в одну переменную.

Специалист же должен учитывать правило 1 поисковая фраза ≠ 1 кластер.

Проблема существующего сайта

Всегда нужно учитывать кластеры существующего сайта, что бы не пострадала уже текущая ситуация из-за пересортировки кластеров внутри сайта.

Кластеризация запросов одной страницы

С выгрузки запросов за 2 недели с одной страницы, при кластеризации с мягкими условиями получил 44 группы!

Что делать:

Проверять соответствие полученных кластеров с текущим сайтом. Если есть запросы из разных кластеров, которые уже идут на одну страницу, проанализируйте, можно ли дооптимизировать существующую страницу или лучше создать новую.

Ошибки специалистов

Из-за незнания алгоритмов кластеризации и нежелания включать голову, ошибки специалистов могут свести пользу от результата кластеризации к нулю.

“Грязное” семантическое ядро на входе

С появлением кластеризации, некоторые специалисты решили, что теперь ядро можно не чистить, т.к. кластеризация все сделает сама и нужно будет в конце просто отсечь ненужные группы.

Но по факту выдача по «пустышкам» и запросам не подходящим для сайта сбивают кластеры и на результате может выйти совсем не то, что ожидали.

Что делать:

Перед подачей на кластеризации ядро должно быть вычищено от пустышек и неподходящих ключей

Ввод входящих без проверки оптимальных параметров

Речь о силе связи и алгоритме Hard и Soft.

Пока универсального рецепта нет и для каждой тематики и ваших требований могут соответствовать свои параметры.

Что делать:

Для себя я вывел следующие параметры под ситуации:

  1. Маленькие точные кластеры = сила связи 3-6 и hard алгоритм
  2. Большие кластеры с достаточной точностью = сила связи 1-3 и hard алгоритм
  3. Кластеры для Power Page = сила связи 2-5 и soft алгоритм

Если не уверен в результате, то делаю проверку на маленькой выборке, после чего кластеризую уже полное ядро.

P.S. параметры актуальны для MindSerp, в сервисах и другом софте параметры могут значительно отличатся по конечному результату

Кластеризация ≠ абсолютная истина

Нельзя принимать кластеризацию, как конечный результат, как минимум по 3 причинам:

  1. Ошибки алгоритмов описанные выше
  2. Выдача меняется и то что сегодня является информационным запросом, через несколько месяцев может стать коммерческим.
  3. Выдача не идеальна — на текущий момент выдача Яндекса зависит от сотен факторов и не всегда их сочетание удачно, в результате эталонной выдачи не существует => кластеризация построенной на такой выдаче не может быть идеальна.

Отсутствие постработы с кластерами

После автоматической работы, практически каждая кластеризация требует доработок со стороны специалиста, что бы получить полные кластеры для оптимизации страницы на конечном сайте.

  1. Следим за интентами. Актуально для «грязных» ядер с слабыми входящими данными, когда интенты могут переходить в ненужные кластеры и наоборот, тогда нужно перекластеризовать или вручную проанализировать и перенести запросы с нужным интентом.
  2. Добираем микроНЧ и НК НЧ запросы. Если мы почистили ядро перед кластеризацией для корректных результатов, это не значит что эти запросы нельзя использовать. Их нужно добавить в готовые кластеры.
  3. Добираем из статистики. Если у вас есть готовый сайт и результаты кластеризации, объедините результаты, что бы получить двойную пользу, добив кластеры запросами из статистики.
  4. Добираем из типовых кластеров. Если у нас типовые кластеры, то мы можем из более популярного кластера проецировать запросы на менее популярным и добавить их в него. Пример «кофеварка bosch» в кластере имеет 20 запросов а «кофеварка kenwood» 5 запросов, из bosch мы можем перенести 15 запросов.

Выводы

Кластеризация отличный инструмент для избегания многих ошибок и ускорения работы по созданию структуры и подбора ключей под страницу.

Зная ошибки при кластеризации, легко их избегать в работе, для этого нужно придерживаться рекомендаций:

  1. Давать чистое ядро на вход
  2. Запоминаем ошибки алгоритмом для понимания, как формировать кластеры
  3. Проводим пост работу: соединяем, разделяем, удаляем, прогнозируем и добиваем уже исходя из собственного опыта и требований проекта
  4. Кластеризация не идеальна, смотрим через призму критики

Презентация с семинара

А как вы решаете проблему с ошибками кластеризации?


Понравился пост? Отблагодари социальным откликом и поделись ссылкой с друзьями:

Типичные ошибки алгоритмов и специалистов в кластеризации: 7 комментариев

  1. Решаем задачу написание собственного кластеризатора, в котором можно выбрать метод кластеризации (Можно выбрать например между KMeans или EM или другие алгоритмы), метод просчета оптимального количества кластеров, метод оценки качества и другие параметры.

  2. Грязное семантическое ядро и провальные позиции сайта — это проблема скорее заказчиков, которые пытаются сэкономить на сеошниках и адекватных инструментах для работы. Когда им в зашквар оплатить 19 баксов за Serpstat, у которые вылизывают свои базы от мусора, то о чем говорить.
    Я работаю уже по принципу: хочешь продвижение — предоставь хорошие инструменты. И если кому-то кажется, что эта трата денег, пользуйся бесплатными — не видать им лидов.

  3. Добираем микроНЧ и НК НЧ запросы. Если мы почистили ядро перед кластеризацией для корректных результатов, это не значит что эти запросы нельзя использовать. Их нужно добавить в готовые кластеры.

    Можно поподробнее про это? Как это сделать с помощью mindserp?

  4. Нужно разбивка по кластерам согласно ПС топу и все будет круто!

    Не из воздуха же …

    Как стандарт.это семантика которая собрана по поисковой выдаче 🙂

  5. «Я работаю уже по принципу: хочешь продвижение — предоставь хорошие инструменты. И если кому-то кажется, что эта трата денег, пользуйся бесплатными — не видать им лидов.» Да ладно… Бесплатные тож хорошо пашут — главное чтоб ручки из правильного места росли.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *