22.01.2020, 14:05

Патент недели: искусственный интеллект выносит мусор

Алгоритм, придуманный в России, поможет избавиться от спама.

Редакция сайта

Теги:

Сделано в России

Изобретения

Искусственный интеллект

Алгоритм

Патент

При непосредственном участии Федеральной службы по интеллектуальной собственности («Роспатента») мы решили ввести на сайте рубрику «Патент недели». Еженедельно в России патентуются десятки интересных изобретений и усовершенствований — почему бы не рассказывать о них в числе первых.

Патент: 2710739

Авторы: Роман Деденок, Дмитрий Голубев, Петр Сальников

Патентообладатель: Лаборатория Касперского

Проблема спама — мусорных, вредоносных и рекламных рассылок — возникла почти одновременно с изобретением электронной почты. Сегодня, по разным данным экспертов, электронные письма, содержащие спам, составляют 70-90% от общего объема почтового трафика. Такой объем «мусорной» информации ухудшает пропускную способность сетей, тратит ресурсы системы обмена сообщения, увеличивает время на обработку электронных писем, несет риски заражения машин компьютерными вирусами, которые в том числе провоцируют утечку данных. С развитием смартфонов и мессенджеров, спам стал появляться и в сообщениях рассылаемых с помощью популярных приложений.

Средства борьбы со спамом — такие же ровесники электронной почты как и сам спам. Это черные и списки, методы контекстной фильтрации спама и многие другие. Но ни существующих методов нельзя назвать полностью эффективным: анализ писем для контекстной фильтрации тоже отнимает много времени, содержание некоторых писем является конфиденциальной, а следовательно не подлежащей открытому анализу, информацией. Современные технологии защиты, например, не обеспечивают эффективного механизма быстрого и статистически точного анализа заголовков электронной почты и символов, из которых состоят заголовки.

Еще одна проблема современных средств борьбы со спамом — так называемые «ошибки первого рода»: ложные срабатывания, когда легитимное письмо определяется как спам без уведомления получателя, что ведет к рискам потери информации. К тому же, сами «спамеры» тоже постоянно «совершенствуют» свои технологии, маскируя спам-рассылки под легитимные письма.

Алгоритм с элементами искусственного интеллекта, разработанный в Лаборатории Касперского, позволяет создать систему правил, которые еще называют эвристическими — дающими «достаточно хорошее решение для достижения результата», — для поиска и обнаружения писем и сообщений, содержащих спам. При этом анализ проводится без отображения содержания писем, что сохраняет конфиденциальность переписки. Поиск и обнаружение спам-писем проводится только с помощью анализа структуры заголовка письма и частично тела письма без раскрытия содержания в обезличенном виде.

С помощью элементов искусственного интеллекта эвристические правила борьбы со спамом, создаваемые алгоритмом, постоянно совершенствуются, объединяются в кластеры, избавляются от устаревших способов и обновляются за счет анализа новых спам-рассылок. Это позволяет совершенствовать систему защиты компьютера, сервера или смартфона в целом, сокращает потери пропускной способности сетей и почтовых серверов, а также избавляет пользователей от необходимости тратить время на самостоятельную фильтрацию почтового траффика и создание собственных защитных черных списков.