Метка текстовая релевантность

Текстовый контент – одна из основ ранжирования. За последние десять лет оценка документов сильно продвинулась и усложнилась. Теперь недостаточно напихать много ключей и выделить их для надежности жирным.

Изучаем метод попарного сравнения для диагностики санкций в Яндексе: три наблюдения

Попарное сравнение – одна из методик определения текстовых фильтров в Яндексе. Очень широко применяется оптимизаторами, лежит в основе ряда SEO-сервисов (инструменты Арсёнкина, Кулакова и Пиксель.Тулс).

15 приемов для оптимизации сайта и анализа ниши на основе карты вхождений

Сегодня утром обнаружил потрясающий комментарий к статье SEO-инструмент: поиск слабых мест текстовой оптимизации (и еще сотня других применений).

SEO-инструмент: поиск слабых мест текстовой оптимизации (и еще сотня других применений)

Прототип этого инструмента я написал год назад. Регулярно пользовался им для разных задач, с трудом представляю, как жить без этого функционала. Сегодня, наконец, прикрутил его к публичной версии  Встречайте – массовая проверка списка url на вхождения ключевика в разные зоны.

Новый бесплатный сервис: поиск тематичных слов (LSI) с помощью нейросетей. Нужна обратная связь!

Вот уже пару месяцев я экспериментирую с word2vec – набором инструментов для анализа текстов от разработчиков Google. Пришла пора не только играться, но и делать с помощью машинного обучения что-то полезное.

Как я поигрался с Word2vec + пара мыслей о машинном обучении с колокольни SEO-шника

В последние несколько месяцев неспешно изучаю машинное обучение. Неспешно – потому что и без него неплохо справлялся с текущими задачами. Также хотелось сначала получить теоретическую подготовку. Использовать machine learning на практике можно и без математических знаний – но приятно разбираться в…

Еще раз о Баден-Бадене, правке текстов и порогах спама. Самая важная моя статья на эту тему

Нет, кофе сегодня не проливал. Но только потому, что полчаса назад я его уже допил. Иначе обязательно поперхнулся бы, испортил клавиатуру и рабочий блокнот.

Запись вебинара по Баден-Бадену + дополнительные ответы по работе с SEО-текстами

На прошлой неделе совместно с организаторами Baltic Digital Days провел вебинар, где рассказал о своих подходах к работе с текстом в связи с выходом алгоритма Баден-Баден.

Продолжаем изучать Баден-Баден. Что считается спамом, где пороги срабатывания фильтра?

Едва опубликовал исследование алгоритма Баден-Баден, как меня буквально завалили вопросами про конкретные цифры для выявленных показателей. На что ориентироваться? Какой уровень водности или там индекса биграммы/униграммы считать хорошим, а какой – плохим? К чему стремиться при доработке текстов? Где буйки, за которые нельзя…