Тема: текстовая релевантность

Текстовый контент — одна из основ ранжирования. За последние десять лет оценка документов сильно продвинулась и усложнилась. Теперь недостаточно напихать много ключей и выделить их для надежности жирным.

Изучаем метод попарного сравнения для диагностики санкций в Яндексе: три наблюдения

Попарное сравнение — одна из методик определения текстовых фильтров в Яндексе. Очень широко применяется оптимизаторами, лежит в основе ряда SEO-сервисов (инструменты Арсёнкина, Кулакова и Пиксель.Тулс).

Читать дальше


15 приемов для оптимизации сайта и анализа ниши на основе карты вхождений

Сегодня утром обнаружил потрясающий комментарий к статье SEO-инструмент: поиск слабых мест текстовой оптимизации (и еще сотня других применений).

Читать дальше


SEO-инструмент: поиск слабых мест текстовой оптимизации (и еще сотня других применений)

Прототип этого инструмента я написал год назад. Регулярно пользовался им для разных задач, с трудом представляю, как жить без этого функционала. Сегодня, наконец, прикрутил его к публичной версии https://bez-bubna.com. Встречайте — массовая проверка списка url на вхождения ключевика в разные зоны.

Читать дальше


Новый бесплатный сервис: поиск тематичных слов (LSI) с помощью нейросетей. Нужна обратная связь!

Вот уже пару месяцев я экспериментирую с word2vec — набором инструментов для анализа текстов от разработчиков Google. Пришла пора не только играться, но и делать с помощью машинного обучения что-то полезное.

Читать дальше


Как я поигрался с Word2vec + пара мыслей о машинном обучении с колокольни SEO-шника

В последние несколько месяцев неспешно изучаю машинное обучение. Неспешно — потому что и без него неплохо справлялся с текущими задачами. Также хотелось сначала получить теоретическую подготовку. Использовать machine learning на практике можно и без математических знаний — но приятно разбираться в том, что ты делаешь, а не просто скармливать данные готовым решениям, которые делают 99% работы. Читать дальше


Еще раз о Баден-Бадене, правке текстов и порогах спама. Самая важная моя статья на эту тему

Нет, кофе сегодня не проливал. Но только потому, что полчаса назад я его уже допил. Иначе обязательно поперхнулся бы, испортил клавиатуру и рабочий блокнот.

Читать дальше


Запись вебинара по Баден-Бадену + дополнительные ответы по работе с SEО-текстами

На прошлой неделе совместно с организаторами Baltic Digital Days провел вебинар, где рассказал о своих подходах к работе с текстом в связи с выходом алгоритма Баден-Баден. Читать дальше


Вариативность текста как показатель для оценки его качества и естественности

К исследованию о факторах, влияющих на попадание страницы под Баден-Баден поступает много вопросов об одном из них — вариативности. Читать дальше


Продолжаем изучать Баден-Баден. Что считается спамом, где пороги срабатывания фильтра?

Едва опубликовал исследование алгоритма Баден-Баден, как меня буквально завалили вопросами про конкретные цифры для выявленных показателей. На что ориентироваться? Какой уровень водности или там индекса биграммы/униграммы считать хорошим, а какой — плохим? К чему стремиться при доработке текстов? Где буйки, за которые нельзя заплывать?..

Читать дальше


Яндекс изнутри: как найти релевантный ответ (заметки к докладам)

Посмотрел свежие доклады сотрудников Яндекса — со встречи в Минске 16 мая, чтобы зафиксировать самые важные и интересные моменты.  Читать дальше