Рассылка по интернет-маркетингу:
Нажимая на кнопку, вы даете согласие на обработку своих персональных данных

LSI-фразы: что это такое и как их собрать

19 января 2021 Алексей Солдат
Время чтения: 9 минут Нет времени читать? Нет времени? 14 комментариев
Отправим материал вам на:
Нажимая на кнопку, вы даете согласие на обработку своих персональных данных
LSI-фразы: что это такое и как их собрать Редакция «Текстерры»
Редакция «Текстерры»

Делюсь самым эффективным алгоритмом поиска LSI-фраз, которые постоянно использую в работе. В итоге вы тоже научитесь за полчаса вычислять необходимое количество LSI и находить нужные.

Что такое LSI-копирайтинг

«Пишите для людей», – говорят они. Как поисковику дать понять, что содержание мой страницы удовлетворяет желания пользователей? Эту задачу выполняет LSI-копирайтинг.

LSI-копирайтинг («латентное семантическое индексирование») – это механика, которая помогает повысить релевантность веб-страницы с помощью поисковых фраз.

Если пользователь вводит в поисковик фразу «консультация гинеколога», он, как минимум, хочет увидеть информацию о ценах, задать уточняющий вопрос и заполнить форму записи. То есть фразы «гинеколог задать вопрос», «гинеколог цены», «запись к гинекологу» и «гинеколог онлайн» являются синонимами запроса.

Поисковик запоминает, на каких страницах пользователи задерживаются дольше и, отталкиваясь контента этих страниц, составляет список LSI-фраз. Далее при поиске он использует уже не только конкретный запрос, но и LSI-фразы.

Поисковик классифицирует страницу как коммерческую или информационную, отталкиваясь в том числе от LSI.

Сложно продвигать коммерческую страницу, если ее текстовый контент изобилует фразами, присущими информационному запросу, и наоборот. То есть LSI важен для правильной классификации страницы.

Один и тот же пользователь на разных сервисах пишет разные запросы, соответствующие одному и тому же интенту. То есть вводит разные запросы в поисковике, YouTube и TikTok, хотя хочет получить один и тот же результат. При наличии доступа к данным разных сервисов можно собрать более обширную базу LSI-фраз.

Ранжирование документов с LSI-оптимизацией и без

Между внутренними страницами сайта и внешними документами рассчитывается связь. Она похожа на связь при перелинковке и получении ссылок с других доменов, но только состоит из слов. Чем сильнее связь, тем лучше ранжируется страница. Напрямую об этом говорит патент Google (ранжирование документов с использованием словесных связей). Чем обширнее представлена LSI-семантика в документе и на сайте целиком, тем проще продвигать страницы.

Без применения LSI в конкурентных сферах делать нечего: поисковик воспримет контент сайта как недостаточно качественный, то есть неудовлетворяющий запросы.

Откуда взять LSI-семантику

Проблема 1. Как придумать синонимы и связанные фразы? Можно использовать мозговой штурм и сбор поисковых подсказок. В таком случае появляется другая проблема.

Проблема 2. Как понять, какие LSI-фразы из полученного массива имеют наибольшее значениее для поисковика?

Есть простой способ решить обе проблемы.

Шаг 1. Сбор маркерных запросов

Маркерные запросы – это костяк семантического ядра. Например, для коммерческого сайта по продаже кирпичей – «купить кирпичи», «кирпичи с доставкой» и т. д.

Маркерные запросы невозможно сократить. Если из фразы «купить кирпичи» удалить одно из слов, оставшееся не будет запросом. Купить можно что угодно, а кирпич сам по себе не коммерческий. Это может быть фото кирпича или самостоятельное изготовление кирпича.

Базовая частотность – это сколько раз встречается фраза «купить кирпичи» во всех возможных вариациях: «купить силикатный кирпич», «купить красный кирпич дешево» и т. д.).

Точная частотность – количество конкретных запросов «купить кирпичи» без уточнений.

Чем больше разница между базовой частотностью и точным вхождением, тем больше можно сделать фраз из маркерного запроса добавляя другие слова и LSI-фразы.

Маркерные запросы имеют своей особенностью большую числовую разницу между базовой частотностью и точным вхождением фразы. Поэтому мы и ищем именно маркерные запросы по конкретному кластеру (смысловой группе) для 1 посадочный страницы.

Сформируйте и постранично сгруппируйте семантическое ядро для продолжения работы. Собирайте пока. Я пойду налью чай – вода уже закипает.

Шаг 2. Поиск конкурентов для изъятия LSI-фраз

Открываем Arsenkin Tools, ищем инструмент «Выгрузка топ-10 сайтов». Забиваем туда все маркерные запросы для одной страницы, выставляем регион (всегда делайте это, даже если сайт без геопривязки) и жмем «Начать проверку».

В качестве альтернативы Arsenkin можно использовать сервисы Key Collector, PR-CY, Serpstat, Pixeltools, Topvisor.

Мы получили по каждому запросу из введенного нами списка по столбику. В каждом столбике 10 сайтов из топа «Яндекса» по этому запросу. Рекламные объявления, разумеется, в столбиках отсутствуют. Столбики разноцветные: одинаковые URL, разбросанные по разным столбикам, подсвечены одним оттенком:

Наша задача – пролистать ниже до этого блока:

Как видите, я уже вычеркнул агрегаторы и выделил первые 10 подходящих ссылок. Эти страницы наиболее часто встречаются в результатах выгрузки, а значит, находятся в топе по большему количеству запросов, чем остальные. Делаем вывод, что маркерные запросы на этих страницах распарсены широко, охватывают много LSI, а страницы имеют хорошие поведенческие факторы.

Шаг 3. Таблица для исследования и веб-анализа LSI-семантики конкурентов

У меня было два варианта – считать все вручную для каждой страницы или внедрить формулы и сохранить шаблон для использования по мере необходимости. Я изготовил шаблон насколько мне это позволили навыки Excel. Я известный профессионал по Excel... Выглядит это вот так:

Обратим внимание на верхний блок и имеющиеся в нем строки: количество символов, тошнота, максимальная тошнота и минимальная тошнота. Мы вычислим эти значения для каждой из 10 страниц, а таблица посчитает среднее арифметическое. Так мы сможем увидеть тренды, в зависимости от которых страницы находятся в топе. Например, объем текста или плотность ключевых фраз.

Чуть ниже находятся два поля – бежевое и серое. Столбец формул левее этих полей представляет из себя переход от средней максимальной тошноты до средней минимальной тошноты, умноженный на 100 для удобства подсчетов.

В желтом поле будут находиться 5 страниц, возглавляющих топ, а в сером поле – замыкающая пятерка. Разница между первой и второй пятеркой заключается в их ранжировании. Первая пятерка имеет кратно превосходящий вес.

Все цифровые значения, которые мы получим в процессе работы, будем умножать на коэффициент. Для желтого поля он составит 1, а для серого – 0,5.

Справа внизу листа 1 – результаты нашей выборки, где каждому слову присваевается ранг. Чем выше ранг, тем ближе к максимальной тошноте должна быть плотность вхождений этого слова в тело документа. Чем ниже, тем ближе к минимуму, но все равно в интервале не меньше минимального.

Шаг 4. Парсинг LSI-фраз и обработка результатов

Переходим на сервис SeoLik (или его аналог p2pi) и находим инструмент «Анализ контента»:

Берем первую из десяти ссылок и вставляем в окошко для анализа контента страницы. В результатах ищем поля с картинок ниже и выписываем значения из них в таблицу в соответствующие ячейки:

На второй картинке видим список слов. Выписываем первые 20 в желтое поле таблицы в столбик. Значение минимальной тошноты для этой страницы у нас будет равно тошноте 20-го слова: «запой», «лечение», «врач», «пациент» и т. д.

Ту же процедуру повторяем с остальными девятью страницами, постепенно заполняя желтое и серое поля:

Теперь остановимся на желтом поле.

Нам нужно найти одинаковые фразы в каждом из пяти столбиков, перемножить каждую на соответствующее ей число из столбика левее желтого поля. Считаем сумму полученных значений, вписываем слово и полученный результат в соответствующие ячейки справа. В столбец «Количество» вписываем число совпадений.

Ту же процедуру проделываем отдельно с серым полем, но результаты вычислений вписываем в столбец с коэффициентом 0,5:

Копируем колонки «Фраза», «Количество» и «Ранг». Создаем новый лист в документе нажимам на ячейку B2 правой кнопкой мыши и выбираем «Специальная вставка» > «Вставить только значения»:

Удаляем столбец «Значения», фильтруем колонку «Ранг» от большего к меньшему. Получаем LSI-семантику. Располагаем слова по важности и узнаем плотность вхождений, которая у них должна быть:

Шаг 5. Сравнение

Теперь у нас два пути.

  1. Ситуация первая – у нас нет страницы. Просто создаем посадочную страницу, отталкиваясь от среднего количества символов, полученных фраз и плотности их вхождений.
  2. Ситуация вторая – у нас уже есть страница. Делаем ее анализ на сервисе SeoLik и выписываем фразы в столбец «Акцептор»:

Шаг 6. Итог

Завершающий этап состоит в сравнении двух списков слов и «подтягивании» LSI-фраз, которые редко встречаются в теле нашей страницы, до необходимого уровня. Проверку проводим в SeoLik (или в p2pi), добавляем нужные фразы или убираем лишние до тех пор, пока столбец «Донор» и «Акцептор» не будут равны.

Сравним донорскую LSI-семантику с LSI-семантикой нашей страницы. Красным маркером пометим фразы, плотность вхождений которых нужно увеличить, а зеленым – слова, которые необходимо удалить:

Мы получили список: «клиника», «реабилитация», «центр», «нарколог», «кодирование», «помощь», «запой». Вписываем слова в текст страницы-акцептора. Проводим повторный анализ контента, получаем результаты, на которых видно, что список и ранг LSI-фраз донора и акцептора приблизительно равны, что и требовалось.

Алексей Солдат
Автор: Алексей Солдат
Все статьи этого автора
© «TexTerra», при полном или частичном копировании материала ссылка на первоисточник обязательна.
Нашли ошибку в тексте? Выделите нужный фрагмент и нажмите ctrl + enter.
Оцените материал:
Хотите, сделаем для вас топовый канал на Дзен? Узнать подробности
Оставь заявку на бесплатное онлайн-обучение
до 1 апреля
00:00:00
Подробнее
До старта онлайн-интенсива
«Продвижение в Instagram» осталось:
00:00:00
Записаться
При заказе SMM до 31 октября дарим
3 варианта оформления сообщества!
Подробнее
Чертовски низкие цены на все онлайн-курсы от
TexTerra с 29 по 31 октября
Подробнее
Готовая база знаний
для начинающего
интернет-маркетолога
Такую информацию продают за деньги,
а мы отдаем БЕСПЛАТНО!

Я согласен на обработку моих персональных данных

Спасибо, база направлена на вашу почту!
МИЛЛИОН ГОДНОТЫ
Дарим подборку огненных материалов по интернет-маркетингу: кейсы, интервью, советы по SMM, полезные видео и не только.
получить
Скидка 20%
на все онлайн-курсы от TexTerra
к курсам
Texterra – продвижение в интернете x
Заказать звонок:
Нажимая на кнопку, вы даете согласие на обработку своих персональных данных
Texterra – продвижение в интернете x
Заказать услугу:
Нажимая на кнопку, вы даете согласие на обработку своих персональных данных