Скажите «сыр»: Пароль на слух

Покажите мне свой смартфон — и я скажу, кто вы. Я смогу проникнуть в вашу личную жизнь и банковские счета, узнать прошлое и разрушить будущее. Современный смартфон давно стал самым близким спутником человека — он не только сопровождает нас повсюду, но и помнит все. Тем важнее становится его защита от несанкционированного доступа.

Обычный способ защитить свой телефон — использование пароля, однако все большую популярность получают различные биометрические технологии, позволяющие идентифицировать владельца по тем или иным уникальным характеристикам его организма. Это могут быть черты лица, узор радужной оболочки глаза. Но куда логичнее было бы использовать просто голос.

«Привет, это я» — и смартфон узнает своего хозяина, открывая ему доступ. К сожалению, на практике все не так просто: компьютерное распознавание голоса пока остается сложной задачей. Голос человека меняется слишком резко — и не только из-за болезни или с возрастом, но и, скажем, когда мы говорим на бегу. Да и, к слову сказать, голос легко записать и, проиграв затем смартфону, обмануть биометрическую защиту.

Из-за этих недостатков идея об идентификации по голосу до сих пор не получила заметного развития. Впрочем, этот процесс может подстегнуть новая работа, проведенная американскими учеными из группы Теренса Булта (Terrance Boult). Предложенная авторами система аутентификации пока что сложновата для постоянного использования, однако на наиболее опасных направлениях — скажем, для контроля над удаленным доступом к банковским счетам — она вполне пригодится.

Система довольно длительно настраивается: пользователю придется «скормить» ей изрядное количество произнесенных слов и фраз. В зашифрованном виде эта информация передается по сети в защищенную базу данных банка, где засекреченный алгоритм вычисляет на ее основе уникальный «голосовой идентификатор» пользователя.

Как только пользователю понадобится обратиться в интернет-банк и получить доступ к своим счетам, он заходит в свой аккаунт, а затем произносит определенный набор слов и фраз — каждый раз разный. Эти слова никуда не передаются и, следовательно, не могут быть перехвачены: с банковского сервера на смартфон отправляются хранящиеся в нем записи сразу нескольких голосов, и смартфон, сравнивая произнесенное со всеми вариантами, лишь сообщает банку номер подходящего. Правильный ответ знает только банк — и сам благонамеренный пользователь.

Этот подход решает и проблему изменчивости голоса: системе необходимо лишь выбрать наиболее близкий к произнесенному вариант, пусть они и будут заметно отличаться. Первые тесты такой системы показали, что такое распознавание не только работает, но и действует лучше большинства аналогов.

По публикации MIT Technology Review / Physics ArXiv Blog