Студентка университета ИТМО Ксения Бурая и ее коллеги научили алгоритм предсказывать семейное положение пользователей c точностью до 86%, используя данные трех соцсетей вместо одной.
Алгоритм научился предсказывать семейное положение по соцсетям

Ученые полагают, что в будущем эти результаты помогут составлять психологический портрет человека по активности в соцсетях. Доклад об исследовании Бурая представит на Конференции AAAI по искусственному интеллекту в Сан-Франциско.

Программисты из Университета ИТМО в Санкт-Петербурге и Национального Университета Сингапура выяснили, что профилирование пользователя сразу по нескольким соцсетям позволяет уточнить его индивидуальные черты. В частности, исследователи сконцентрировались на такой характеристике, как семейное положение, и, объединив данные из Twitter, Instagram и Foursquare, научили алгоритм предсказывать этот параметр с точностью до 86%, что на 17% точнее, чем по одной соцсети.

Чтобы алгоритм понимал данные, на которых его будут обучать, ученые превратили активность пользователей из Нью-Йорка, Сингапура и Лондона в наборы, или векторы, из таких параметров, как средний размер твита, наиболее частые объекты на фото, распределение чекинов и другие. Затем к этим векторам программисты применили базовые модели машинного обучения.

О том, как человек взаимодействует с миром, можно узнать из соцсетей. Ксения Бурая объясняет:"Согласно многим научным источникам, психотип человека тесно связан с его семейным положением. Поэтому мы решили проверить, насколько точно сможем предсказать этот параметр, чтобы в будущем использовать его для определения психотипа".

Профилирование пользователя, как считает студентка, может быть полезно в широком спектре областей. Например, рекрутеры смогут заранее узнать больше о людях, которые устраиваются на работу. Метод характеристики личности по активности в соцсетях позволит вычислять членов опасных группировок, а также находить людей, склонных к депрессии или самоубийству, и предлагать им своевременную помощь.

Исследование опубликовано в сборнике материалов 31 конференции Ассоциации по развитию искусственного интеллекта (AAAI).