4 мин на прочтение

Аналитика на основе баз данных: где брать и как чистить базу данных?

Основные источники данных для аналитики — Google Analytics и Яндекс.Метрика. Но работая с этими инструментами, можно столкнуться с проблемами:

  • что-то не успели внедрить или внедрили недавно;
  • где-то собралось мало данных;
  • что-то внедрили некорректно, поэтому данные с ошибками;
  • лимиты инструментов аналитики (например, семплирование — анализ полной базы на основе части данных). Читайте подробнее о семплировании и о том, как его обойти.

В Google Analytics нет кнопки «отменить». Если данные собраны неправильно, пересчитать их невозможно. Поэтому аналитикам стоит пользоваться и другими источниками:

  • Базы данных о товарах, заказах и Клиентах (CMS, ERP, CRM);
  • Рекламные аккаунты (Google Adwords, Яндекс.Директ);
  • Статистика сервиса (MailChimp, Youtube, Google Webmaster, Яндекс.Вебмастер).

Каждая система и сервис собирает свою статистику. Выгружайте эти данные, чтобы анализировать и улучшать работу проекта. Но выгрузить — это ещё не все. Базу данных нужно подготовить к работе.

Очистка данных

1. Ненужные сегменты
Розничные и оптовые покупатели ведут себя по-разному. Если анализировать пользователей вместе, получим кашу. Отфильтруйте Клиентов по принципу розница/опт. И анализируйте только один из сегментов.

2. Заказы от сотрудников и тестовые заявки
Клиент набрал по телефону. Менеджер получил заказ. И оформил его через свой email. Заказ есть. Но стоит ли брать его в анализ? Сотрудник знает, как устроен сайт. И ведёт себя не так, как покупатели. Слушайте в подкасте о том, как сотрудники искажают данные для анализа.

Отфильтруйте заказы менеджеров и тестовые заявки программиста. Удалите из анализа корпоративные емейлы, которые содержит домен сайта.

Если корпоративных адресов нет, смотрите на список самых частых покупателей. Выделите топ-100 Клиентов, которые покупали больше всего. Все технические аккаунты попадут в список. И вы сможете отфильтровать сотрудников вручную.

3. Статусы заказов
Обязательно фильтруйте заказы по статусу. Отменён или выполнен.

4. Период времени
Помните, когда и что вы внедрили. Когда данные начали фиксироваться правильно. Когда появилось новое поле в базе.

Отфильтруйте базу по 4 пунктам. На выходе после очистки вы получите узкий сегмент: выполненные розничные заказа только от Клиентов за 2015 год.

Добавляйте другие критерии для сегментации, которые подойдут вашему бизнесу.

Просмотрите базу еще раз. В ней могут быть ошибки, которые невозможно определить автоматически. Например, программист настроил, что по умолчанию в базе фиксируется неправильный параметр. Поэтому проверяйте данные вручную.

Принципы очистки

Выгрузите данные в Excel. Это самый простой инструмент. В Excel включите автофильтры:

  • сортируйте по самым большим и маленьким значениям;
  • удалите пустые ячейки;
  • определите неправильные данные.

Дальше стоит найти «жирафов».

Что такое жирафы? Средний рост всех животных Африки, включая жирафов — около 2 метров. Но если жирафов не считать — 1,5 метра.

Жирафы могут поселиться и в вашей выборке. Это нетипичные потребители — сотрудники, оптовые Клиенты, посредники. Они искажают картину при анализе.

Вы вручную выгрузили и очистили данные. Поняли, кого нужно отсегментировать или отфильтровать. В будущем вам много раз нужно будет проделывать такую работу. Поэтому лучше поставить задачу программистам на автоматическую очистку. И экономить время в будущем.

Как собирать сырые данные корректно?

1. Валидизировать данные на входе
Например, в поле телефон можно писать только цифры. А чтобы привести номер в правильный формат, пропишите начало номера. Для Украины «+380…», для России «+7…».

2. Добавить признак «сотрудник» в базе данных

3. Завести причину отмены заказа — «тестовый»

4. Продумать «склейку» профилей
Один и тот же человек для покупок на сайте авторизируется через профиль в Facebook, email и телефон. Получаете 3 разных Клиента, вместо одного. Картина смазывается.

Склеивайте пользователей по номеру телефона, адресу доставки, ФИО.

5. Импортировать исправления в базу данных
Если вы исправили ошибки в базе данных, не забудьте их импортировать.

6. Ввести в процесс обработку новых ошибок коллегами
Например, менеджер принимает заказ по телефону. В админке ему высвечивается «проверь email этого Клиента».

Обогащение данных

Базу данные легко обогатить. Дописать характеристики на основе информации, которая у вас уже есть.

  • Из Goole Analytics → CRM (ключ — номер заказа в e-commerce);
  • Из IP → город, регион, страна (по базе GeoIP);
  • Из имени и отчества → Пол;
  • Из адреса → Расстояние (по API карт);
  • Из товаров в заказе → Размер;
  • Из социальных сетей → Интересы, чекины, друзья, возраст;
  • Из товаров → Характеристики, отзывы (по API Яндекс.Маркета).

Хороший сервис для структурирования и обогащения базы — dadata.ru.

Заливаем в dadata такие данные:

dadata

На выходе получаем структурированную таблицу:

dadata

Доработка структуры БД

  • Разнесите поле 
ФИО на отдельные поля — фамилия, имя, отчество.
  • Заведите отдельные поля для параметров, вместо «комментарий к заказу».
  • Структурируйте ввод данных — в этом поле можно ввести только текст или только цифры.
  • Настройте связь по API c другими сервисами. Например, Яндекс.Карты.

База данных готова к анализу.

Выводы

Используйте базы данных для аналитики. Перед анализом базу нужно подготовить:

  • выгрузить сырые данные;
  • очистить от лишней информации;
  • обогатить дополнительными данными;
  • структурировать.
Подробнее об анализе данных узнайте на курсах по веб-аналитике
Читай также:

Кто делает подкасты о бизнесе на русском языке и сколько они приносят

11 октября 2017 Секрет Фирмы

Как делать подкасты — опыт Романа Рыбальченко c кейсом «Продуктивный Роман»

15 декабря 2017 AIN.ua

Роман Рыбальченко о 7 факторах стресса и как с ними бороться

27 июля 2017 Лайфхакер

Кейс читателя: Почему мы потеряли клиента, несмотря на успешное продвижение его интернет-магазина

19 мая 2015 vc.ru

Поднять якорь: как Александр Баденко создал маркетплейс топливных талонов

13 июля 2019 Oilpoint
avatar
Вадим Ошкало
Руководитель intimo.com.ua

Cистемность — это «религия» Романа. Так что работая с Roman.ua Вам прийдется её принять и получить все вытекающие бонусы.

Все отзывы 81

Мы помогли более 200 Клиентам. Слово «Клиент» мы всегда пишем с большой буквы.

  • Macphun
  • Intimo
  • Prom.ua
  • Autoportal.com
  • Київстар
  • Kingston
  • SemRush
  • Dobovo
Работаем удаленно и в офисе в Киеве.

Любим путешествовать и увеличиваем продажи Клиентам по всему миру.