Сотни, тысячи камер наблюдения — будь то камеры ГИБДД или службы охраны супермаркета, банка, метрополитена — сегодня бесцельно транслируют картинку на мониторы, на которые никто толком и не смотрит. Но завтра все может измениться — программа русских ученых способна опознать в людском потоке любого, чей трехмерный портрет есть в ее банке данных.

Когда я пришел в гости в компанию A4vision, один из ее основателей и, по совместительству, директор по технологиям Артем Юхин первым делом провел меня к прибору, который за считаные секунды построил трехмерную модель моего лица. Модель эта, будучи занесенной в специальную пластиковую карту, могла открывать передо мной двери в здании. Не все, конечно — только те, куда разрешен доступ гостям. Так началось мое знакомство с первой в мире реально работающей системой распознавания лиц.

Про «автоматические узнавалки» я слышу уже лет 10 как минимум. Каждый уважающий себя университет в Европе и Америке имеет хотя бы одну лабораторию «компьютерного зрения», где задача автоматического узнавания людей является «классической» темой для защиты диссертаций и получения грантов. Все они занимаются так называемым «искусственным интеллектом», то есть, говоря проще, нейросетями, которые обучают узнавать людей. И соревнование между лабораториями идет в плоскости «а я сделал нейросеть больше, чем ваша!», или «моя система различает мужчин и женщин лучше, чем живой человек!». Практической полезности такие системы до сих пор не имели — узнать человека в реальных условиях не получалось — все они требовали идеальных условий, возможных только в лаборатории. Различия в освещенности кадра, положении источников света, ракурсе лица на снимке, а также макияж и очки — все эти факторы можно игнорировать в лаборатории, но не обойти в жизни. Жизнь показала, что «классическая» задача компьютерного узнавания человека по фото является нерешаемой в общем случае. Артем жалуется, что, когда они с другом, Андреем Климовым, вышли c работающей технологией на рынок, их поначалу никто не хотел слушать, так как все были уверены, что системы распознавания лиц просто не могут работать. Но двое выпускников Бауманки построили первую в мире систему трехмерного распознавания лиц (в том числе ввели в обиход сам термин), которая действительно работает.

Антропология и жизнь

Артем Юхин и Андрей Климов познакомились во время учебы в университете. Артем писал диплом по проблемам компьютерного зрения, где и предложил идею трехмерного сканера, Андрей занимался математической статистикой. Вместе они разработали первую в мире систему трехмерного распознавания лиц, которая построена на хорошо известных антропологических принципах. Антропологи прекрасно знают, как устроен череп, ткани и кожа человека, и могут по фрагментам черепа воссоздать лицо давно умершего человека (см. статью «Истинное лицо Иисуса» в январском номере «ПМ» за 2003 год). Работая совместно с антропологами и криминалистами, ребята узнали о существовании так называемых опорных точек на лицевой части черепа. Измерив расстояние между определенными точками на лице человека, можно создать уникальный для каждого биометрический портрет.

Компания A4vision не сразу пришла на рынок биометрических систем. Ребята экспериментировали в самых разных областях. Например, они сделали программно-аппаратный комплекс для лицевых хирургов. Оказывается, до 70% людей, которые приходят на операцию по коррекции лица, уходят, так и не решившись, из-за того, что не могут себе представить, как будут выглядеть после хирургического вмешательства. А значительная часть тех, кто решился, остаются недовольны, так как полученный результат не совпал с их ожиданиями. Комплекс удался — система позволяла показать человеку, как он будет выглядеть после операции. Более того, специальный прибор вырезал из пластика модель головы в натуральную величину, так что «нового себя» можно было даже потрогать. Однако выяснилось, что рынок таких систем слишком мал, чтобы оправдать дальнейшие разработки, и все работы по проекту были заморожены. Один из самых успешных на сегодня проектов — сотрудничество с компанией Logitech, по заказу которой A4vision создала специальную программу для веб-камер Logitech. Если вы пользовались вебкамом для видеоконференций, то знаете, что обычно 70% картинки — это общий план комнаты, где сидит ваш собеседник, а не его лицо. Если же навести на лицо, то малейшее движение — и оно пропадает из кадра. A4vision разработала алгоритм, который следит за человеком в кадре и вырезает фрагмент изображения так, чтобы большую часть кадра занимало лицо. При движении головы система моментально подстраивается, и лицо остается в кадре. Было продано более 2 миллиона камер Logitech с «начинкой» от A4vision.

Трехмерное лицо

Раздумья основателей компании о ее будущем и эксперименты в разных областях были прерваны трагическими событиями 11 сентября 2001 года. Неожиданно весь мир перевернулся — возник невероятный спрос на всевозможные биометрические системы. И технология распознавания лиц вдруг оказалась востребованной на уровне государств. Выбор был очевиден, и A4vision бросила все силы на разработку систем безопасности и создание серийных систем по заказу правительств разных стран. К тому же выяснилось, что конкурентов у технологии 3D Facial нет — как уже упоминалось, системы двумерного распознавания лиц фактически неработоспособны, а другие «биометрические» системы либо слишком неточны (геометрия руки), либо слишком сложны в применении (сетчатка глаза), либо легко подделываются (отпечатки пальцев).

Как же работает система 3D Facial компании A4vision? В принципе, как говорит сам Артем, ничего сверхъестественного там нет. Сначала делается трехмерный «слепок» лица. Для получения такого «слепка» в Голливуде используют невероятно сложные и дорогостоящие сканеры. К тому же и объект должен быть неподвижен в течение достаточно длительного времени. Артем с Андреем придумали другой способ. Их сканер представляет собой комбинацию дешевого полупроводникового лазера (как в бытовом CD-плеере) и не менее дешевой цифровой камеры, расположенными под углом друг к другу. Кстати, для изготовления первого образца ребята просто купили цифровой фотоаппарат за безумные для них тогда $300. Человек подходит к прибору так, чтобы видеть себя в небольшом зеркале. Это нужно для правильной ориентации лица относительно лазера и камеры. Лазер «рисует» на лице сетку, а камера фиксирует изображение. Точно зная, где должны проходить линии сетки, программа вычисляет рельеф лица и строит его трехмерную модель. В этом и заключается главное ноу-хау изобретателей. Весь процесс занимает считанные секунды. Как только «маска» снята, она кодируется специальным образом и заносится в банк данных. Аналогичные считывающие устройства ставятся в любом месте, где необходима идентификация. Устройства распознавания работают фактически в реальном времени — опознавание не занимает времени вообще, то есть происходит постоянно. Мне показали тестовую программу — я смотрел на монитор, видел себя, вращал головой, корчил рожи, всячески пытался обмануть систему (к слову, это мне так и не удалось) и в реальном времени видел, на сколько процентов мое настоящее изображение сходится с тем, что записано в банк данных. Но это — только основная технология. На ее базе разработано огромное количество технологий вспомогательных, сопутствующих главной.

Зачем это надо

Первым делом я спросил Артема, кому это все надо. Он рассказал, что биометрические системы можно условно разделить на две группы — системы «для хороших парней» (good guys) и «от плохих парней» (bad guys). Первые системы рассчитаны на законопослушных граждан, которые готовы сотрудничать со сканером и заинтересованы в том, чтобы система их опознала. Скажем, тот, кто часто летает, мог бы пройти специальное сканирование и получить карточку путешественника, по которой бы быстро проходил на рейс через сканер без дополнительного паспортного контроля, клиенты банков могли бы обойтись без PIN-кода в банкомате и т. д. Вторые системы рассчитаны на врагов общества, то есть на выявление в толпе людей, которые пытаются изменить свою внешность, чтобы избежать идентификации. Эти системы гораздо менее эффективны и более сложны. Компания A4vision занимается, в основном, разработкой систем первого типа — в большинстве случаев они нужнее и пользуются наибольшим спросом на рынке.

«Основная сфера применения нашей технологии на сегодняшний момент — это обеспечение безопасности и контроль доступа в помещения. Сканеры А4vision уже установлены в аэропорту Милана, где они обеспечивают безопасность доступа в служебные помещения аэропорта. A4vision также активно работает над очень масштабным проектом с одним из лондонских аэропортов, где технология будет использоваться для проверки пассажиров при получении посадочных талонов и при посадке в самолет. В данном случае задача — сделать невозможной ситуацию, при которой пассажиры меняются посадочными талонами. Система А4vision также установлена в Королевском банке Шотландии, при входе, для контроля доступа в секретные помещения банка», — рассказывает Артем.

Еще одно интересное применение — система автоматической блокировки и разблокировки компьютера. Вы отошли от монитора, вебкам увидел это и заблокировал компьютер. Вы вернулись — и система снова работает. Вы заняты секретными работами, а сзади кто-то подошел — система увидит это и заблокирует машину.

Лицо в толпе

Несмотря на то что на сегодняшний день системы «для плохих парней», по словам Артема Юхина, не пользуются большим спросом, технология трехмерного распознавания лиц, разработанная A4vision, позволяет создать такую систему: ведь трехмерная камера работает как обычная телевизионная камера — на расстоянии, без всякого участия человека, и может быть скрытой. По сути, система «для плохих парней» является системой тотального слежения, которую можно использовать против всех. Самое сильное впечатление на меня произвела демонстрация системы распознавания лиц, которые на доли секунды появляются на мониторе камер слежения. Представьте себе, что все камеры ГИБДД, банков, магазинов, метрополитена, на которые сегодня никто толком не смотрит, завтра будут сведены в единый центр, где каждый источник сигнала постоянно анализирует программа. Она в режиме реального времени опознает всех, кто есть в ее базе данных. А это — все водители, все, кто когда-либо был арестован или задержан, летал на самолете, имеет счет в банке, входил в любое здание, оборудованное сканером, ездил в метро и так далее. Представьте систему, которая будет записывать место и время, когда она «увидела» вас, и сможет искать по своей обширной базе данных. Самое интересное заключается в том, что системе вовсе не обязательно знать ваше имя! Например, если на всех турникетах в метро установить такие сканеры, то система будет «узнавать» любого пассажира, и не важно, что она часто не знает его имени. А теперь представим, что камера слежения за автостоянкой зафиксировала, как некий человек выезжал на автомобиле, который на следующий день был заявлен в угон. Если система «узнала» водителя, она, даже не зная его имени, сможет рассказать о нем все — где он живет, где ездит, какими банкоматами пользуется, в какие кинотеатры ходит и т. д. То есть найти человека станет элементарно просто. Именно в этом, по‑моему, и состоит главная опасность такой системы.

Еще месяц назад мы обсуждали на редколлегии вопрос — возможен ли автоматический тотальный контроль за передвижениями граждан. Я открыто смеялся над подобными предположениями. Сегодня мне уже не смешно. Единственное, что внушает оптимизм, — это факт, что в России, где за скромные деньги купить любой госсекрет, в том числе базу данных сотрудников милиции и спецслужб, может каждый, систему тотального наблюдения никогда не введут — ведь это провалит все операции МВД, ФСБ и прочих служб. Кому нужен оперативник, раскрыть которого можно при помощи простого устройства и программы к нему. Кстати, как раз такое устройство, разработанное для дорожной полиции США, показали мне в офисе A4vision.

Статья «» опубликована в журнале «Популярная механика» (№10, Октябрь 2004).