Как известно, люди делятся на «физиков» и «лириков». Согласно укоренившемуся стереотипу, первые — это суровые ученые, чуждые каких-либо сантиментов, «технари», в свободное время выводящие на салфетке не первой свежести многоэтажные уравнения. «Лирики» же — писатели, художники и люди искусства — имеют монополию на всяческие проявления любви к прекрасному. Между тем математические выкладки, которые обычно ассоциируются с сухими цифрами и многостраничными таблицами, могут быть весьма наглядны и очень красивы.

Нужно просто увидеть то, что скрыто за ними. И конечно, показать всем остальным, как это делает Крис Харрисон, аспирант отделения компьютерных наук Университета Карнеги-Меллон.

«Программисты, занимающиеся компьютерными алгоритмами, обычно пишут свои методы для других программистов, не заботясь о том, как их разработки воспринимают конечные пользователи, — говорит Крис Харрисон, аспирант лаборатории по изучению взаимодействия человека с компьютером (Human-Computer Interaction). — Я же имею дело именно с тем, как человек воспринимает все эти данные. Вот так, на стыке этих двух миров у меня и появилась идея отобразить некоторые цифры в столь необычной форме. Впрочем, я рассматриваю это именно как хобби».

«Не стоит искать в этих иллюстрациях глубокий научный смысл, — объясняет Крис. — Просто смотрите и наслаждайтесь сложностью и красотой тех данных, с которыми мы сталкиваемся в повседневной жизни, но обычно не можем воспринять. Мои визуализации дают этим данным голос, форму. Это подобно живописи, но вместо мазков кисти художника я использую компьютерные алгоритмы, а вместо красок — цифровые данные. Нравится ли моя «живопись' людям? Многие считают, что эти картины нельзя считать искусством, поскольку они слишком аналитичны. Но есть и такие, кто видит в этих графиках и строгую красоту, и скрытые от невооруженного глаза связи между привычными понятиями».

Годовые кольца

Если спилить дерево, то по кольцам можно определить, сколько ему лет, как оно росло, были ли эти годы засушливыми или наоборот. По аналогии с этой моделью Крис рассмотрел процесс публикации и обсуждения тематических материалов в на сайте Digg.com, где члены сообщества сами размещают заметки. Различная тематика обозначена различными цветами, толщина каждого кольца пропорциональна популярности (количеству просмотров). Верхний ряд — распределение колец по месяцам, нижний — по дням недели (усредненные данные за год с 24.05.2007 по 23.05.2008).

Карта книжного магазина Amazon

Владелец сайта theinfo.org Аарон Шварц составил список из 735 323 книг, доступных для покупки в одном из крупнейших онлайн-магазинов — Amazon. Более того, он попытался объединить их с помощью 10 316 775 связей. Крис построил по этим данным «карту мира», использовав программу, старавшуюся расположить «связанные» книги как можно ближе друг к другу. После 140 часов работы программы среднее расстояние между «связанными» книгами сократилось с 350 до 9. Цветами обозначена тематика, а если использовать очень высокое разрешение, то можно даже рассмотреть обложки книг.

Древний гипертекст

Это одна из самых простых и наглядных визуализаций, построенная на основе данных, предоставленных Крису лютеранским пастором Кристофом Рёмхильдом. Пастор рассмотрел Библию как гипертекст, то есть набор текстов, содержащих узлы перехода (ссылки) от одного текста к другому. Всего потребовалось отследить и обработать более 63 000 гиперссылок, содержащихся в тексте Библии. Однако целью при этом не было построение модели книги для изучения (для этого существует ряд гораздо более функциональных программ). Вместо этого, Крис решил сосредоточится на другом аспекте — не функциональном, а эстетическом.

Эта диаграмма дает возможность понять, насколько сложна эта древняя книга. Столбики внизу обозначают главы Библии, причем длина каждого столбика пропорциональна количеству стихов в этой главе. Каждая из чередующихся серых и белых полосок обозначает очередную книгу Библии.

Верхняя часть диаграммы отдана под связи между текстами Библии. Каждая из 63 779 ссылок соединяет два отрывка текста. Для большей наглядности дуги сделаны цветными — цвет обозначает «длину» гиперссылки, в результате чего образуется своего рода «радуга».

Библия как социальная сеть

Еще один очень красивый пример визуализации разрозненных данных — это построение своеобразной библейской социальной сети. Крис проанализировал текст книги (использовалась Библия короля Якова), обращая внимание на имена людей и географические названия (всего 2619), которые встречаются в одном стихе — в этом случае считалось, что между ними есть связь. Затем он построил вот такую распределенную социальную структуру, в которой размер пропорционален количеству связей (их более 10 000). Имена и названия с более чем 40 связями написаны горизонтально, а остальные — под углом.

Третье измерение Википедии

Изучая связи между различными темами, Крис не мог обойти своим вниманием такой источник данных, как Википедия (Wikipedia). Эта энциклопедия охватывает различные области знаний, причем любой желающий может добавить, дополнить или исправить любую статью. В результате английский вариант сейчас содержит более 2,5 млн. статей (для сравнения, знаменитая Британская энциклопедия содержит 120 тысяч статей), причем это число постоянно растет.

В центре каждого графа находится вершина (тематическая категория), от которого отходят связи к вершинам «дочерних» категорий, которые, в свою очередь, связаны с темами еще на уровень ниже. Связи обозначены различными цветами в зависимости от вложенности тем. Граф построен таким образом, чтобы длина ребер была минимальна. При таком алгоритме построения вершины третьего уровня образуют своеобразные «острова» на поверхности сфер, в центре которых находится какая-либо тематическая категория.

Статья опубликована в журнале «Популярная механика» (№11, Ноябрь 2008).
Понравилась статья?
Подпишись на новости и будь в курсе самых интересных и полезных новостей.