Материалы

Автоматическая оцифровка аудитории


Одним из наиболее частых запросов, поступающих нам от клиентов, является автоматическая оцифровка аудитории с использованием технологии распознавания лиц. Как результат клиент получает объективную и полную информацию по демографии своих посетителей и их настроению в разрезе часов, дней недель и месяцев; частоту посещений, может проводить A/B тестирование.

Для начала, термины и определения.

Автоматическая оцифровка аудитории (персон) – процесс автоматического создания первичных шаблонов персон из видеопотока. Новые шаблоны создаются если персона не была найдена в базе данных.

Шаблон персоны представляет собой уникальное набор цифр, вектор, рассчитанный по изображению лица человека (персоны). Именно уникальность шаблона персоны позволяет нам, при идентификации персоны, осуществлять поиск искомой персоны серди всех уникальных первичных шаблонов находящихся в базе данных и выдавать ответ: есть такой (с определенной степенью точности) или такого в базе данных нет. Важно отметить, что из векторов невозможно восстановить исходные изображения лиц и вся дальнейшая работа осуществляется с векторами.

Рассмотрим автоматическую некооперативную оцифровку аудитории. Некооперативная оцифровка подразумевает, что люди НЕ выполняют никаких специальных действий для оцифровки. Именно поэтому автоматическое создание шаблонов персон при некооперативном поведении это очень сложная задача с множеством факторов, на которые не всегда можно повлиять в процессе оцифровки.

Просто представьте — необходимо, в автоматическом режиме, поймать то самое мгновение, когда все параметры и требования к качеству изображения сошлись и можно сделать первичный шаблон. Мы правильно располагаем камеры, правильно настраиваем их, делаем все, чтобы получить максимальный результат, но учесть ВСЕХ вариантов поведения людей, которых нужно оцифровать, и всех вариантов внешней среды мы не можем.

Также на оцифровку влияют два параметра настройки системы: углы поворота и наклона лица и размер ректа (рект – изображение лица, вырезанное из видеопотока):
  • если «зажать» настройки, то есть выставить минимальные углы и достаточно крупный размер лица, то качество первичных шаблонов персон будет отличным (что крайне положительно для дальнейшей работы), но оцифровать с первого раза всех людей может не получиться и придется ждать следующего шанса: следующего визита персоны;
  • если «ослабить» настройки, то есть разрешить углы большие и размер лица небольшой, то первичных шаблонов персон будет больше, но в таком случае может снизиться их качество. Например, можно ослабить настройки так, что для одной персоны будет создано 3 первичных шаблона персоны: слева, справа и в фас.

Для идентификации качество первичного шаблона персоны очень важно — чем лучше шаблон, тем лучше, устойчивее и точнее идентификации этой персоны в будущем. И наоборот, при шаблоне не высокого качества точность идентификаций в будущем будет снижаться — будет много идентификаций с низкой степенью уверенности в точности. Поэтому процент успешно оцифрованных персон за определенный временной интервал, например, две недели, в каждом конкретном случае у каждого клиента разный.

Итак, метод автоматической некооперативной оцифровки аудитории НЕ даёт 100% результата – 100% подсчёта людей. А какой результат даёт? Каждый раз результат разный. И каждый раз клиенту, учитывая свою бизнес задачу и особенности своего бизнеса, нужно сделать выбор при оцифровке:
  • пытаться получить максимально качественные шаблоны для долгой и уверенной работы в будущем, немного пожертвовав скоростью оцифровки. Например, если планируются дальнейшие коммуникации с этими людьми, интеграция с CRM системами и подобным;
  • получать шаблоны не самого высокого качества, но быстро получить срез по демографии, по посещаемости, по другим параметрам, а качество шаблонов потом можно улучшить через механизм реинициализаци первичного шаблона.
По нашему опыту и опыту наших Клиентов при использовании автоматической некооперативной оцифровки аудитории процент оцифровки колеблется от 60% до 94%, что достаточно привлекательно по соотношению затрат и полученного бизнес результата.
Made on
Tilda