Для государства распознавание лиц — важная часть системы безопасности и внушительная статья бюджета. Для журналистов это либо панацея, либо инструмент глобального заговора. Для бизнеса - инструмент или продукт. Независимо от того, какую сторону вы принимаете, основные вопросы все равно остаются. Пользователи привычно ищут ответы на них в Интернете (в среднем 28 704 запроса на распознавание лиц в месяц), но не всегда находят. Исправляем ситуацию.
Что такое распознавание лиц
Отделите мух от котлет. Пользователи чаще сталкиваются с распознаванием лиц на собственных смартфонах, где для разблокировки устройства используется биометрическая идентификация, а доступ к данным может получить только владелец. В процессе распознавания обязательно задействована 3D-камера, чтобы невозможно было обмануть гаджет с фото.
Есть и идентификация лиц в реальном времени и в реальных условиях: в данном случае она неразрывно связана с системами видеонаблюдения, где лица буквально «выхватываются» из видеопотока, захваченного камерами.
Представим себе качественную современную камеру видеонаблюдения, размещенную чуть выше среднего человеческого роста в хорошо освещенном месте. Ежедневно перед ним проходит примерно одинаковое количество примерно одинаковых людей. Они не двигаются очень быстро.
Записанное видео можно хранить в облачном архиве. К камере подключен аналитический модуль: сложная комбинация алгоритмов (искусственный интеллект, нейронные сети и все такое) плюс пользовательский интерфейс. Модуль «выхватывает» лица из видеопотока, определяет пол и возраст и заносит данные в базу данных.
Постепенно образов становится больше. Система автоматически запоминает все распознанные лица и архивирует их, а пользователь с правами указывает дополнительные данные: имя, должность, статус, другие отметки («VIP-гость» или «вор»). Вы можете загрузить фото нужного человека, и модуль найдет в архиве все обнаружения этого человека.
Как только человек с отметкой снова проходит перед камерой, система фиксирует это как важное событие и отправляет push-уведомление заинтересованным пользователям.
Детекция в контексте распознавания лиц — это ситуация, когда алгоритм в принципе понял, что это лицо, а не яблоко или русалка из кружки Starbucks. Ему для этого сначала нужны вычислительные мощности, и только потом он может сопоставить лицо с базой или запомнить.
Если вы дочитали предыдущие несколько абзацев до конца, поздравляю, теперь вы знаете, как работает распознавание лиц в идеальной ситуации. Описание подходит для любой системы: от тех, что используются в московском метро, до решений для малого бизнеса.
Главное понимать, что создать идеальную обстановку в реальной жизни сложно, особенно если речь идет о целом городе, а не офисе или магазине. Допустим, в метро много людей, все разные, едут быстро. Камер нужно много, они стоят денег, и ставить их должны грамотные специалисты.
Можно ли обмануть алгоритм распознавания лиц
Несмотря на случайные промахи, точность машинного распознавания уже зачастую превосходит ту, с помощью которой люди определяют лица. Вскоре в Китае появится система, которая сможет найти конкретного человека среди 1,3 миллиарда других жителей за 3 секунды с точностью 90 %.
И все же сложно ответить на этот вопрос однозначно, ведь не существует единого идеального алгоритма распознавания лиц. Большие очки, приклеенная борода, кепка, высокая скорость передвижения, особый макияж (например, нарисованная на лице решетка) — все это может запутать алгоритм. Особенно в совокупности, ведь для распознавания достаточно 70% открытого лица. А теперь представьте, что вам нужно использовать вышеперечисленные приемы в реальном городе. Звучит не так просто, правда?
Очки "антиузнаваемость" из Японии, выпущенные еще в 2015 году
Возможно ли онлайн-распознавание лиц
Интернет — парадоксальное место: люди здесь могут одновременно переживать, определяет ли их личность каждая вторая камера на улице, и искренне хотеть «узнавать лица других людей по онлайн-фото». Рассмотрим это направление распознавания лиц отдельно.
Программа распознавания лиц представляет собой либо описанный выше аналитический модуль (камера наблюдения + программное обеспечение + облачное хранилище), либо программное обеспечение, аналогичное известному (слегка скандальному) сервису FindFace. Сегодня скачать программу распознавания лиц «бесплатно и без регистрации» в подавляющем большинстве случаев, конечно же, невозможно.
Веб-сервис FindFace.ru, помогающий находить людей в социальной сети «ВКонтакте» по их фото, был основан 18 февраля 2016 года. Среди прочего, благодаря ему каждый смог найти профили девушек, снимавшихся в порнофильмах. Очень скоро сервис стал использоваться для множества флешмобов по выявлению лиц, которые имели полное право никогда и никем не быть обнаруженными. Разразился скандал, сработавший как вирусная реклама: технология, которая легла в основу сервиса, получила ряд престижных наград и вызвала интерес заказчиков со стороны государства и бизнеса. С 1 сентября 2018 года сервис больше не предоставляет услуги поиска людей по фото, так как NtechLab трансформировал его в линейку решений для различных сфер бизнеса.
Сон пользователя, который вводит запрос, очевидно, выглядит так: вы заходите на сайт, загружаете фото человека, сделанное украдкой в метро, программа распознает лицо и дает ссылку на профиль в социальной сети. Ага, понял! Или так: скачиваете программу на компьютер, подключаете к ней веб-камеру и узнаете морду своего кота. Успех - теперь вы будете получать уведомление каждый раз, когда кот ворует сосиски.
Реальность жестока. Первый сайт, который вам это предлагает, отказывается работать, а второй требует навыков программирования на Python. Более-менее похожее на приложение мечты называлось SearchFace, которое недавно перезапустили как FindClone. Вы загрузили фото, а алгоритм попытался распознать это же лицо в базе социальной сети ВКонтакте. Приложение не выдавало ссылки на профиль, только сами картинки — и неважно, кто их залил. Если пользователь долгое время был активен в социальной сети, выдача фото создавала жуткий «биографический» эффект, а если нет, то распознанные изображения могли рассмешить.
Собственно, пример SearchFace четко отвечает на вопрос «Как в социальных сетях используется распознавание лиц?». Правильнее было бы сформулировать это так: «Как социальные сети используются для распознавания лиц?» Ответ прост: как база данных. Неисчислимое количество уникальных комбинаций цифр (а именно так выглядят лица на фотографии для алгоритмов Facebook*, ВКонтакте и других) составляет основу для обучения нейронных сетей, лежащих в основе того или иного решения по распознаванию лиц.
Решения у всех разные, и нейросети тоже разные, а заказчики и поставщики услуг, как правило, не раскрывают подробности и технические особенности. В частности, модуль распознавания может определять пол и возраст за счет того, что может узнавать информацию, содержащуюся в Одноклассниках, ВКонтакте, Instagram* и Facebook*.
Как запрограммировано распознавание лиц
Вы никогда не должны отвечать на вопросы разработчиков и для разработчиков, если вы не являетесь разработчиком. Поэтому мы обратились за помощью к специалисту.
Распознавание лиц (равно как и другие сопутствующие операции) — довольно типичная задача. Поэтому многие компании предоставляют готовые услуги в виде облачных API (программных посредников между приложениями) для качественного решения этих задач. Помимо IT-гигантов вроде Microsoft и Google, распознаванием лиц занимаются и специализированные компании, в том числе и российские. Их продукты быстро развиваются и предоставляют еще больше интересных функций, таких как идентификация лиц и силуэтов в толпе.
Обучить нейронную сеть с нуля самостоятельно гораздо сложнее. Нужен большой и качественный набор исходных данных, то есть десятки и сотни тысяч (а то и больше!) фотографий людей. Кроме того, потребуются значительные вычислительные ресурсы и знания в области ИИ и машинного обучения. У крупных компаний есть все эти инструменты, поэтому они решают задачу намного качественнее.
Есть и промежуточное решение — использовать уже обученную нейросеть, например OpenFace. Этот вариант, скорее всего, будет работать чуть хуже, чем готовый облачный сервис, но зато позволит иметь полный контроль над системой. Для этого потребуется определенный уровень понимания работы нейросетей и нейросетевых фреймворков и, по-видимому, некоторое знание языка Python, который завоевал популярность как основной язык программирования среди специалистов по данным.
Действительно, на нем удобно проводить различные эксперименты, визуализировать данные и производить эффективные вычисления матриц благодаря отличному пакету NumPy. Это не лучший язык для промышленной разработки, так как он не содержит эффективных инструментов для создания больших защищенных программных комплексов, а альтернатив ему в области обучения глубоких нейронных сетей нет.
Как распознавание лиц работает в бизнесе
Востребованность распознавания лиц в финтехе, ритейле и других видах бизнеса напрямую связана с повышением доступности технологий. Механика проста: на всех предприятиях и во всех организациях есть камеры видеонаблюдения, которые используются как инструменты для сбора данных и последующей аналитики. В мире систем видеонаблюдения в месяц снимается терабайт Full HD видео, то есть накапливается много информации для обработки.
Необходимое программное обеспечение для анализа данных может быть «прошито» производителем на устройство. Камеры с видеоаналитикой «на борту» обычно стоят достаточно дорого.
Альтернативный вариант — аналитика в облаке, то есть удаленный дата-центр, который подключается к любой недорогой камере. Это на порядок дешевле, плюс дает гибкость — можно адаптировать решения под конкретный бизнес.
Возрастает популярность технологии распознавания лиц в различных сферах деятельности. Например, Сбербанк является одним из лидеров по анонсированию различных громких проектов по распознаванию лиц, и поспорить с ним в этом плане может только Тинькофф. В 2017 году Сбербанк приобрел 25,07% акций VisionLabs, компании, которая создает программное обеспечение для распознавания лиц. В 2018 году финучреждение успело протестировать распознавание лиц в московском метро и даже поймало 42 преступника, протестировало банкоматы с идентификацией по лицу, чтобы злоумышленники не могли снять деньги с чужих карт, и объявило о сборе биометрических данных (аудиозапись голоса). , видеозапись лиц) клиентов. В апреле этого года Сбербанк приобрел контроль над разработчиком систем распознавания голоса и лиц — Центром речевых технологий (ЦРТ).
Другое дело, что анонсировать, тестировать, пилотировать и покупать решения еще не значит их реально внедрять. Что именно сейчас используется в Сбербанке (и используется ли), по сути, с уверенностью может сказать только Герман Греф.
С розницей все более прозрачно. По сути, здесь есть три проблемы, которые решает распознавание лиц.
Во-первых, воровство. Мошенники действуют в магазинах, а часто одни и те же люди в одной и той же сети. Распознавание лиц позволяет идентифицировать «бродячих воров» и других людей, ранее нарушивших порядок. Как только занесенный в базу нарушитель один раз зайдет в магазин, охрана получит уведомление в мессенджер или другим удобным способом.
Во-вторых, сложность работы с постоянными клиентами. Просто недостаточно данных о покупках и днях рождения, чтобы персонализировать предложения для VIP-клиентов и поклонников бренда. Распознавание лиц можно интегрировать с CRM — то есть софтом, в который менеджеры вносят всю информацию по всем сделкам организации. В случае с ворами и VIP-персонами распознавание лиц работает примерно так же: лицо заносится в черный или белый список, а при повторном появлении система сигнализирует о человеке, имеющем доступ. Пол и возраст определяются автоматически, а дополнительная информация будет добавлена ответственным сотрудником.
В-третьих, идентификация по лицу в ритейле используется для таргетированной рекламы. Например, в некоторых магазинах X5 Retail Group установлены камеры для распознавания выражения лица и возраста покупателей. Анализируя эти данные, система выводит товары, которые могут понравиться человеку, на экран монитора в торговом зале. Другой живой иллюстрацией является случай Lolli & Pops, большой магазин сладостей в США. Система распознавания лиц идентифицирует постоянных клиентов и отправляет на их смартфоны уведомления с продуктами, которые могут им понравиться (с учетом индивидуальных предпочтений и даже пищевой аллергии).
Еще один яркий пример использования технологий в ритейле — магазины без продавцов и касс. Например, Alibaba Tao Cafe — это кафе и магазин самообслуживания, расположенный в Ханчжоу. Здесь продаются напитки, закуски, продукты, игрушки, рюкзаки и тому подобное. Tao Cafe открыто только для пользователей сайта Taobao.
При покупке напитков камера с функцией распознавания лиц автоматически идентифицирует покупателя, подключается к его учетной записи в интернет-магазине и обрабатывает платеж. Покупатели выходят через помещение, оборудованное несколькими датчиками, идентифицирующими как покупателя, так и товар. Сканирование работает, даже если человек положил покупку в карман или сумку.
Как развивается технология распознавания лиц
Системы видеонаблюдения Face ID действительно захватывают мир. В Москве количество камер в 2019 году достигнет 174 000. Это не означает, что все эти устройства могут распознавать человека по умолчанию: чаще всего сообщается о 160 000 камер с этой функцией. Тем не менее, в конце 2018 года мэрия Москвы заявила о намерении заменить все устройства видеонаблюдения и сформировать в следующем году полностью инновационную систему.
Парадокс в том, что 160 тысяч не так уж и много. Особенно если сравнивать с другим лидером поисковых запросов по тематике распознавания лиц — Китаем. На конец 2017 года там было более 170 миллионов камер наблюдения, а в ближайшие три года планировалось подключить еще около 400 миллионов.
Грамотное и правильное использование распознавания лиц работает в первую очередь на повышение безопасности и комфорта. Люди обычно быстро проникаются доверием к технологиям, которые избавляют их от очередей на футбольный матч (улыбнулся в камеру — прошел), предотвращают воровство и хулиганство или помогают меньше тратить на покупки (программы лояльности). Все это, конечно, требует некоторого регулирования — именно поэтому принимаются законы о защите персональных данных.
В будущем, вероятно, распознавание лиц в системах видеонаблюдения будет регулироваться аналогично текущей практике работы с идентификацией по лицу в Интернете. Люди, заботящиеся о конфиденциальности, просто не загружают слишком много в Интернет — частичное фиаско SearchFace доказывает, что такая стратегия эффективна.
Конечно, нельзя бесконечно ограничиваться прогулками по улицам, где на каждом перекрестке установлены камеры, однако возможность остаться анонимным будет сформирована, если будет соответствующий запрос со стороны общества.