Человек — это то, что он лайкает

|
Версия для печатиВерсия для печати
Фото:

От революций до разводов. Какую информацию о человеке и обществе может дать анализ сообщений в социальных сетях.

Каждую секунду в соцсетях регистрируются восемь новых пользователей. Каждый час сети пополняются миллионами лайков, сообщений, фотографий, видео. О чём могут рассказать эти потоки данных? Исследователи наперегонки создают программы, способные извлекать все больше полезной информации из социальных сетей. Будьте бдительны: каждый ваш лайк содержит информацию о вас!

1. Посты и неологизмы

«Репостить», «лайкать», «комментить» — все эти слова плотно вошли в наш лексикон, но до сих пор остаются за рамками словарей. Ученые из Высшей школы экономики и МГУ им. М.В. Ломоносова решили исправить ситуацию и на материалах фейсбука составили список неологизмов русского языка.

Для этого было обработано 573 млн. постов 3,2 млн. пользователей (это почти 40% русскоязычного фейсбука): все тексты автоматически разбивались на слова, которые потом искали в Открытом корпусе русского языка OpenCorpora. Дальше эксперты вручную процеживали получившийся перечень неологизмов, созданный из слов, не найденных в корпусе.

В итоговом списке оказалось 168 слов. Подавляющее большинство из них англицизмы, связанные с интернетом или мультимедиа («фотоотчет», «видеоблог»). При этом образование всех неологизмов подчиняется строгим грамматическим правилам. Единственным исключением стали слова вроде «ржач», «махач», «срач»: это «ч» как элемент словообразования стало более продуктивным именно благодаря социальным сетям.

2. Хештеги и революция

Влияние социальных сетей на мир стало очевидным во время «арабской весны», когда выснилось, что восставшие координируют свои действия и мобилизуют массы с помощью фейсбука и твиттера. А нельзя ли использовать соцсети для предсказания таких событий?

Этим вопросом задались учёные из Кембриджа и Гарварда, разработавшие программу, которая высчитывает индекс политической поляризации и измеряет уровень напряжённости в обществе — близость к революционной ситуации. Для этого исследователи проверили 7000 сообщений египтян в твиттере во время волнений 2013 года на наличие радикальных хештегов вроде «#не забудем, не простим» — в Египте существует почти точный аналог этого выражения.

Хештеги — это такие отметки, которые начинаются со знака «#», знакомят с темой сообщения и позволяют распознавать «своих» в информационной войне. Оказалось, что их анализ вполне пригоден для прогнозирования: пики упоминания радикальных хештегов действительно предшествовали реальным столкновениям.

В тему: Рзвитие технологий до 2099 года - прогноз

3. Лайки и сексуальная ориентация

«Человек — то, что он лайкает», — могли бы изречь учёные из Кембриджа, исследовавшие лайки 58 тыс. пользователей Фейсбука и обнаружившие взаимосвязь между мимолётными предпочтениями и более глубокими личностными характеристиками.

Разработанная ими программа отличает белых от афроамериканцев с точностью до 95%, республиканцев от демократов — 85%, мусульман от христиан — 82%. Менее успешно программа «угадывает» семейное положение (точность — 65%), курение (73%) и употребление наркотиков (65%). Позволяют лайки судить и о сексуальной ориентации: для мужчин — с точностью 88%, для женщин — 75%.

При этом корреляции не всегда бывают прямыми: например, только 5% геев лайкали однополые браки и другие столь же специфические события. Программа делает выводы, опираясь на косвенные данные вроде музыкальных предпочтений. Допустим, поставить лайк Hello Kitty — значит признать свою открытость и эмоциональную нестабильность, а любители спиральной картошки фри наверняка идентифицируются как обладатели высокого интеллекта.

4. Фейсбук и настроение

Ничто человеческое интернету не чуждо. Рождение детей и революции, катастрофы и праздники — все главные события реальной жизни неминуемо фиксируются на страницах социальных сетей. Вот и решил Александр Панченко, старший исследователь московской «Лаборатории цифрового общества», написать программу, определяющую общее настроение русскоязычного сегмента фейсбука.

Его алгоритм находит в текстах эмоционально окрашенные слова, список которых составлен экспертами (негативные — «страшный», «скучный», позитивные —  «любимый», «бесплатный»). Далее высчитываются доли положительных, отрицательных и нейтральных слов в тексте и уже по ним – индексы эмоциональности.

Оказалось, что позитивные тексты появляются в фейсбуке в 7,5 раз чаще негативных. Вообще же посты, как и пользователи, чутко реагируют на реальные события: на графике хорошо видны вспышки радости в выходные и праздники и провалы, совпадающие с войнами, стихийными бедствиями и массовыми протестами.

В тему: Мозг обманывает человека

5. Твиты и простуда

Министерство здравоохранения США объявило конкурс на лучшую программу, которая по твитам вроде «Кажется, я заболел. Чувствую себя совершенно разбитым» сможет отслеживать распространение болезни. Победила команда исследователей из Университета Джонса Хопкинса.

Их алгоритм анализирует 5000 коротких сообщений в минуту и отсеивает те, что не касаются здоровья конкретного пользователя (к примеру, «Обама сегодня не впечатлил. Приболел, наверное»). В результате по проценту «простуженных» твитов программа в режиме реального времени собирает достоверную информацию о количестве заболевших в стране и путях распространения инфекции.

В тему: Цукерберг занялся разработкой домашнего робота

6. Френды и расставания

Даже если вы предпочитаете не афишировать романистические отношения, компьютерная программа все равно сможет вычислить вашего партнера в списке «френдов». Ну, не всегда, конечно, но в 60% случаев. Алгоритм создали Джон Клейберг из Корнельского университета и инженер Facebook Ларс Бакстром. Для отработки программы они собрали данные о 1,3 млн пользователей, указавших свое семейное положение и имевших от 50 до 2000 френдов.

Алгоритм отслеживает, сколько социальных групп связывает между собой двух людей. Например, она знакома с его коллегами по работе, а он с ее друзьями по школе, и больше никто из этих обособленных сообществ друг с другом не связан. Чем больше таких мостиков, тем выше вероятность, что пара состоит или будет состоять в романтических отношениях. И наоборот: программа предсказывает вероятность расставания, даже, если в статусе стоит «в отношениях с…».

Михаил Петров, Ирина куропаткина; иллюстрации - Георгий Мурышкин; опубликовано в журнале «Кот Шрёдингера»


В тему:


Читайте «Аргумент» в Facebook и Twitter

Если вы заметили ошибку, выделите ее мышкой и нажмите Ctrl+Enter.

Система Orphus

Новини

20:00
У неділю гроза лише на південному сході України, тепло
18:07
Олександр Чебаненко: Про чергову імітацію, паспорти чоловікам за кордоном та біг влади по граблях
16:05
Адепти московського патріархату мають психічний розлад та потребують медичної допомоги, - лікар о. Олексій Данилов
14:13
Офіційно: ЗСУ контролюють дві третини сіл Очеретиного та Соловйового на Донецькому напрямку
12:05
Провал оборони в Очеретино створив для ЗСУ загрозу поразки майже у всій Донецькій області
10:04
У квітні 2022 року "зелена влада" планувала здати росії суверенітет України, цьому запобіг Джонсон - Die Welt
09:01
Уночі збито 21 з 34 ракет окупантів, але є влучення у 4 ТЕС
08:00
ГЕНШТАБ ЗСУ: ситуація на фронті і втрати ворога на 27 квітня
20:00
У суботу в Україні дощі лише на сході, на півдні до +25°С
18:05
Від Чорнобилю 1986 - до Чорнобилю 2024: ядерна енергетика нашої країни підійшла до небезпечної межі

Підписка на канал

Важливо

ЯК ВЕСТИ ПАРТИЗАНСЬКУ ВІЙНУ НА ТИМЧАСОВО ОКУПОВАНИХ ТЕРИТОРІЯХ

Міністр оборони Олексій Резніков закликав громадян вести партизанську боротьбу і спалювати тилові колони забезпечення з продовольством і боєприпасами на тимчасово окупованих російськими військами територіях. .

Як вести партизанську війну на тимчасово окупованих територіях

© 2011 «АРГУМЕНТ»
Републікація матеріалів: для інтернет-видань обов'язковим є пряме гіперпосилання, для друкованих видань – за запитом через електронну пошту.Посилання або гіперпосилання повинні бути розташовані при використанні тексту - на початку використовуваної інформації, при використанні графічної інформації - безпосередньо під об'єктом запозичення.. При републікації в електронних виданнях у кожному разі використання вставляти гіперпосилання на головну сторінку сайту argumentua.com та на сторінку розміщення відповідного матеріалу. За будь-якого використання матеріалів не допускається зміна оригінального тексту. Скорочення або перекомпонування частин матеріалу допускається, але тільки в тій мірі, якою це не призводить до спотворення його сенсу.
Редакція не несе відповідальності за достовірність рекламних оголошень, розміщених на сайті, а також за вміст веб-сайтів, на які дано гіперпосилання. 
Контакт:  [email protected]