Увеличиваем точность данных в Яндекс.Метрике по 5 направлениям

Когда сеошник вырастает из коротких штанишек, он начинает открывать Метрику и Analytics не только для того, чтобы… хм, полюбоваться на красиво растущие графики. На первый план выходит сложная сегментация данных, детальный анализ точек входа и конверсий.  Короче говоря – продвинутые возможности незаслуженно охаянной новой Яндекс.Метрики. Если вы используете систему статистики именно для серьезной аналитики, то вряд ли вам нужно доказывать, насколько важна точность исходных данных.

Расскажу о нескольких простых приемах увеличения корректности статистики.

1. Устанавливаем счетчик как можно выше в коде

Эта рекомендация есть даже в официальной справке.

Положение счетчика действительно очень важно. Если поставить его в конец кода, система не засчитает посетителей, которые покидают сайт, не дождавшись его полной загрузки. А это лишит вас ценных данных об отказах и помешает с ними бороться.

Кроме того, искажения могут быть очень велики. Мне знаком случай, когда установленные в разные места Analytics и Метрика выдали количество посетителей, отличающееся более чем в два раза (кстати, если наблюдаете у себя подобную проблему – проверьте скорость работы сайта).

2. Фильтруем пользователей, не входящих в ЦА

Анекдот:

Директор открывает планерку.

– Сколько человек посетило вчера наш сайт?

– 42.

– Так. В нашей фирме 43 сотрудника. Какой гад не зашел?

Шутки шутками, а на слабо посещаемых сайтах команда проекта может серьезно повлиять на статистику.

Чтобы этого избежать, идем в настройки счетчика – Фильтры и:

  1. Ставим галку “Не учитывать мои визиты”.
  2. Добавляем фильтр по ip сотрудников, работающих над сайтом.

Если над сайтом работает много удаленных сотрудников, фильтрация по IP может оказаться неудобной. Идеального решения на такой случай нет, как вариант, можно обязать сотрудников заходить на сайт только по ссылке с меткой вроде “utm_source=corporate”. Или сделать так, чтобы все зашли один раз по ссылке с параметром, повесить куку, а затем отслеживать заход посетителей с этой кукой через цель типа “событие JavaScript”.

Страницу “Фильтры” не закрываем, она нужна и для следующих пунктов.

3. Фильтруем роботов

Устанавливаем опцию “фильтровать роботов по строгим правилам и по поведению” (самый жесткий вариант). После вступления в силу настроек, общее количество отображаемого трафика на сайте может серьезно снизиться. Учитывайте это, если сайт не ваш, а клиентский.

Заказчикам, не имеющим обширного опыта в интернет-маркетинге, зачастую крайне сложно доказать, что важно не количество посетителей как таковое, а клиенты, которых приносит сайт. Казалось бы, представители реального бизнеса, приходя в Интернет, должны заботиться в первую очередь о заказах/покупках. Так происходит не всегда: магия растущих графиков затягивает.

4. Принимаем данные только со своих доменов

Процитирую официальный клуб Метрики:

На этой неделе многие наши пользователи заметили появление в отчётах Метрики (Популярное, Вебвизор) просмотры страниц из доменов, не имеющих никакого отношения к счётчику.

С технической точки зрения ничего невозможного в такой ситуации нет: это был спам. Да, наравне с почтовым и поисковым спамом, такой “спам статистики” тоже существует. Мы локализовали источник этого спама и заблокировали его.

Почему же Метрика принимает хиты, относящиеся к другим доменам? Это сделано ради удобства пользователей: очень часто владельцы счётчиков не указывают в настройках адрес сайта. Или, установив код отслеживания на ещё один сайт, забывают прописать его в качестве зеркала. Если Метрика бы по умолчанию не учитывала просмотры с таких неуказанных сайтов, это создавало бы лишние неудобства.

Каждый пользователь может сам включить фильтрацию, запрещающую Метрике учитывать просмотры с каких-либо других сайтов. Для этого необходимо указать адрес сайта и все необходимые зеркала в настройках счётчика, а затем в разделе “Фильтры” настроек счётчика добавить правило фильтрации “Оставить только трафик – URL страницы – сайт и зеркала”.

К сожалению, таким образом не получится заблокировать весь рефспам (недействительные переходы с “левых” сайтов). Банить сайты, “загаживающие” статистику переходов в htacess я считаю нерациональной тратой ресурсов (список доменов ведь постоянно меняется), в случае необходимости проще создать и сохранить сегменты, отсекающие рефспам, в самой Метрике.

5. Боремся с “внутренними переходами”

Думаю, все видели в отчетах  источник трафика “внутренние переходы”. В действительности Метрика так регистрирует посетителей, которые провели длительное время на сайте: один визит разбивается на несколько, причем истинный источник показывается только для первого визита.

Если внутренние переходы вам мешают, то большую их часть легко удалить, присоединив к 1 визиту. Цитата из справки:

Визит завершен, если между действиями посетителя на сайте прошло некоторое время. По умолчанию — 30 минут. Вы можете указать другое время с помощью опции тайм-аут визита.
Например, тайм-аут равен 30 минутам. Посетитель зашел на сайт и просмотрел несколько страниц — визит засчитан. Затем оставил вкладку браузера открытой и отошел. Через 35 минут вернулся (период тайм-аута истек) и перешел на другую страницу сайта. Этот просмотр считается новым визитом.

Таким образом, чтобы избавиться от внутренних переходов, нужно перейти в настройки счетчика (таб “Основное”) и указать тайм-аут, например, в 360 минут.

Внимание: не следует изменять тайм-аут просто так, “на всякий случай”. Сначала убедитесь, что изменение правил расчета количества визитов не исказит результаты регулярно отслеживаемых показателей или экспериментов. Общее количество отображаемых визитов – уменьшится, глубина просмотра – немного вырастет, учитывайте это.

Для ряда целей вполне достаточно будет просто убрать внутренние переходы с помощью соответствующего сегмента.

Например (кликабельно):

Разумеется, фильтровать можно и другими способами. На мой взгляд, этим Метрика и хороша – она дает массу альтернативных путей для быстрого построения любых отчетов, а в нюансах, которыми они различаются, можно обнаружить весьма ценные данные. Имеющий голову да найдет!

6 комментариев

    • А в чем конечная задача? Для чего нужно отсечение в вашем случае?
      То, что нельзя указать в качестве атрибуции и первый источник и последний – логично.

  1. хотя бы без копания в екселе быстро сформировать отчет по целевым запросам. в аналитиксе это, например, можно сделать.
    еще как пример, проследить в динамике рост брендовых запросов.

    • Для динамики – можно и 2 раза посмотреть (+ доп. инфа появится).
      Для отчета – пожалуй, без сторонних инструментов и правда никак.
      Я бы по API получал список и пропускал бы через фильтр. Если это регулярная задача, проще 1 раз написать скриптик.

  2. “Если поставить его в конец кода, система не засчитает посетителей, которые покидают сайт, не дождавшись его полной загрузки. ”
    Это да – но зато и уменьшается показатель отказов, а значит и поведенческие факторы в целом.
    А так, мне кажется, большинство и не знает, что с этим делать – ну уходит человек тут же, и что? Проверяешь скорость загрузки сайта – всё нормально. Но это не значит, что у других не будет по-другому. И это ведь наверняка не единственная возможная причина.

Оставить ответ