На заре развития поисковых технологий, а в частности, до 2013 года оптимизаторы группировали семантические ядра практически в ручном режиме. Кластеризация значительно упростила и ускорила этот процесс. Благодаря чему, появилась возможность в сжатые сроки собирать большие сайты, уже заточенные под поисковые запросы. В такой ситуации трафик добывается в больших объемах и быстрее. А сайт имеет наиболее полную структуру, способную ответить практически на любой запрос пользователя по тематике сайта.

Кластеризация – это автоматическая группировка поисковых фраз, разделение семантического ядра на кластеры.

Например, вы собрали 10000 поисковых фраз по теме ставки на спорт.

Задача кластеризатора – разбить весь этот список фраз на группы, каждую из которых можно отнести к одной странице.

Существуют два основных вида кластеризации – Hard и Soft.

По методу Hard поисковые фразы объединяются в группы (кластеры) при условии, что у них один общий набор url, то есть все они показываются по одному и тому же набору урлов в ТОПе выдачи. Получается меньшее количество групп, много запросов не группируются, но такой метод позволяет быстро собрать запросы из одной тематики, например, квесты. Также легко собрать структуру сайта с нуля.

Метод Soft отличается от Hard тем, что за основу берется самый частотный запрос и остальные запросы просто сравниваются с ним по количеству url. Если хоть у одной пары запросов есть одинаковые url, то они объединяются в группу. При такой кластеризации получается много групп, но точность ее не так высока, как у Hard. Soft кластеризация подходит для мультитематичных сайтов, например, для онлайн гипермаркета бытовых товаров.

Также есть понятие сила связи, она зависит от общего количества url для пары фраз.

Кластеризовать также можно по составу фраз, когда слова (леммы) встречаются в паре фраз , то они объединяются в одну группу. У состава фраз есть сила связи, она зависит от количества общих лемм в паре поисковых фраз.

В принципе кластеризация отлично подходит для больших ядер, состоящих из тысячи, десятков и сотни тысяч запросов. Однако, на практике полностью в автоматическом режиме сделать не получится, все равно потребуется ручная корректировка.