Уже давно не секрет, что всевозможные террористы и экстремисты широко используют Интернет для набора новых сторонников, ведения пропаганды, обмена опытом и планирования терактов. Но даже масштабы деятельности в таких «темных углах» Сети остаются тайной. На борьбу с ними выходит команда специалистов проекта Dark Web.
Темная сторона Сети: Интернет-антитеррор

Скорость, масштабы, многообразие и анонимность сетевых коммуникаций делают их почти идеальным каналом связи для воинствующих групп. По некоторым данным, сегодня насчитывается более 5 тыс. веб-сайтов, созданных и поддерживаемых организациями, которые международное сообщество признало террористическими — среди них и иракские боевики, и Аль-Каеда, и чеченские сепаратисты. Некоторые из них создаются сразу на множестве популярных языков, создавая массированный источник пропаганды. Не стоит забывать и об онлайн-форумах, электронной почте и других средствах коммуникаций «в реальном времени». Отслеживание и анализ происходящего в Сети становится все более важным и в деятельности органов разведки и безопасности. Однако объемы информации настолько велики, что их традиционные методы не справляются с потоком.

Проект Dark Web, над которым работает группа Хсинчун Чена (Hsinchun Chen), спонсируется сразу несколькими федеральными ведомствами США. Основная задача его — систематический сбор и анализ «террористического» контента в Интернете. Для этого разработчики намерены использовать современные средства автоматического анализа контента. По словам профессора Чена, современные математические методы анализа паттернов сообщения позволяют обнаружить скрытые взаимосвязи там, где даже человек не заметит ничего.

Один из методов, уже созданных в рамках проекта, называется Writeprint. Он автоматически вычленяет и анализирует тысячи структурных, лингвистических и семантических особенностей текста, позволяя определить их авторство, причем делает это сразу на нескольких языках. К примеру, Writeprint способен просмотреть сообщение на электронной доске объявлений и сравнить его с текстом, обнаруженным в совершенно другом источнике — на основе общих характерных черт стиля, он с 95-процентной вероятностью узнает, если автором их был один и тот же человек. Если автор признан подозрительным, в следующий раз система сама оповестит оператора о том, если тот же человек оставил где-то новое сообщение, или даже если где-то в Интернете появилась его копия, или если на сообщение появилась новая ссылка.

Для отслеживания происходящего Dark Web использует программы-«спайдеры», похожие на те, что реализованы в популярных поисковых системах. Они автоматически обходят Сеть в поиске интересующих материалов. Этим «неводом» постоянно вылавливаются все новые данные о пропаганде, идеологии, взаимодействии, финансах, управлении террористических групп, о наборе новых членов.

Стоит заметить, что это далеко не первый случай использования интернет-технологий органами безопасности. Достаточно вспомнить знаменитую «шпионскую «википедию»», о которой мы рассказывали в заметке «На службе лысого орла».

По пресс-релизу National Science Foundation