В начале января кафедра коммуникации Рижского университета имени Страдыня совместно с лабораторией исскуственного интеллекта Института математики и информатики представила уникальный исследовательский инструмент - индекс агрессивности Интернета.
Чтобы подробнее узнать о новинке, корреспондент Вестей Сегодня побеседовала с Клавом Седлениексом - социальным антропологом и автором изначальной идеи проекта.
Клавс Седлениекс, конечно, не одинок - созданием индекса агрессивности и дальнейшими исследованиями, связанными с ним, занимались еще пять человек, главной задачей которых было увидеть уровень агрессии общества в целом, понять язык, который используют комментаторы в Интернете, и как меняется общественное настроение в динамике.
На встречу со мной Клавс Седлениекс приходит не один, а с багажом. Предупреждая все лишние вопросы, он тут же садится рядом и достает компьютер.
- Я вам сейчас покажу! - говорит он мне не мешкая и сразу же указывает на экран, где появляются несколько графиков.
Это тот самый инструмент, результат исследований нескольких лет. И любой неравнодушный человек может зайти на страницу http://barometrs.korpuss.lv/, чтобы посмотреть, как все это выглядит, двигается и меняет краски.
Для своих исследований господин Седлениекс и его коллеги выбрали три новостных портала: достославные Apollo, Delfi и TVnet - три солнца, вокруг которых и вертится индекс агрессивности. И комментаторы именно этих порталов оказались подопытными кроликами ученых людей.
- Если в стране появляется какое-то определенное настроение, то оно обязательно влияет и на комментаторов, - начинает рассказывать господин Седлениекс. - Наблюдая за тем, что эти комментаторы говорят, какие слова употребляют, мы можем сказать, что происходит в государстве, т. е. экстраполировать свои наблюдения на все общество.
- А разве комментаторы новостных порталов - это не выведенные каким-то особым способом ядовитые личности?
- Мы можем допустить, что комментаторы как личности в среднем более агрессивны, но нас интересует не сам высший пункт накала, а то, каким образом меняется кривая агрессивности в течение времени, - объясняет социальный антрополог. - То есть если я, допустим, сумасшедший, а общество потихоньку разжигается, то я разжигаюсь вместе с этим обществом, может быть, чуточку больше, чем надо. Но если общество в целом успокаивается, то и я успокаиваюсь вместе с ним.
Проверить это, конечно, трудно, но один из способов убедиться в том, что агрессивность - это не только особенность отдельных индивидов, - посмотреть уровень агрессии на разных новостных порталах и сравнить колебания их кривых. А изучив комментаторов наших порталов, становится ясно, что общество в целом одинаковыми настроениями реагирует на какие-то определенные новости.
Клавс Седлениекс тут же открывает график, объединяющий результаты агрессивности по нашим трем братьям.
Действительно, у кого-то накал выше, у кого-то ниже, но у всех подопытных одинаковый рисунок, т. е. у всех порталов подъем агрессии идет в одно и то же время, в один и тот же период. Отличается лишь только высота подъема.
Как только я разглядываю красоту и гармонию всех трех кривых во всей их полноте, ловким движением руки Клавс Седлениекс переходит к новому рисунку.
- Если взять больший отрезок времени, - говорит он, - например, период начиная с 2011 года, можно заметить определенные долгосрочные тенденции. В принципе, на протяжении всех этих лет кривая довольно спокойная.
Но здесь сразу видно, что в январе 2014 года начинается повышение агрессии в связи с войной на Украине. Это событие очень сильно повлияло на настроения нашего общества.
На этом же графике я замечаю самую высокую точку, которая явно не связана с Украиной, но которая уж слишком выделяется в море долгосрочного спокойствия, и спрашиваю, что это такое.
- Да это же 16 марта, - радостно сообщает господин Седлениекс.
Да, действительно март. И пик агрессивности приходится именно на этот день. Так что день памяти легионеров - это наш латвийский Эверест, праздник, который всегда с нами и который до сих пор никого не отпускает и не оставляет равнодушным.
- Здесь видно, - замечает исследователь, - что у нас в стране имеют место сезонные колебания агрессивности. В феврале кривая начинает расти и в марте достигает пика, а дальше идет ровно. Ноябрь, декабрь и январь - спокойные месяцы, там у нас Рождество и одна сплошная радость. Еще одно падение наблюдается в июле, и это связано скорее с отпусками. Те же самые вещи наблюдаются и во всем мире - там тоже присутствует некоторая сезонность.
- А что происходит на русских версиях порталов и кто из нас более агрессивен? - любопытствую я.
- Да практически то же самое и происходит, что удивительно. Настроения практически те же самые. В те же дни, что и у латышей, кривая идет вверх, в те же дни уходит вниз. Так что русские и латыши в этом плане особо друг от друга не отличаются. Единственное, есть разница в ключевых словах, по которым определяется агрессивная настроенность комментария. Так вот для русских порталов у нас больше ключевых слов.
А вообще нельзя исследовать абсолютную величину. Мы не можем сказать, что вот эта величина агрессивна, как и не можем сказать, чему она должна равняться. Мы лишь в состоянии определить, что вот здесь было меньше или больше.
- С чего начался ваш проект и что послужило вдохновением для исследований? - наконец подбираюсь я к долгожданному вопросу.
- Все началось в 2011 году, когда в воздухе уже витали такого рода идеи. Знаете, в мире существуют и другие похожие исследования, которые работают по такому же принципу: берутся тексты из Интернета и при помощи математических формул раскладываются по полочкам.
Так вот в 2011 году в журнале Science появилась первая публикация на эту тему. Но она на меня совершенно не повлияла, так как на тот момент я о ней даже не знал. И можно сказать, что идея изучать агрессивность в Интернете пришла нам в голову примерно в то же самое время, когда она пришла и другим ученым. Разница лишь в том, что они исследуют Twitter, а мы - комментарии к новостным порталам, такого больше нет нигде в мире.
- Это что, правда?
- Да. Порталы новостей изучаем только мы. Хотя Twitter в этом плане более доступен для исследований, так как там можно видеть, из какого города пришел текст и во сколько. Есть возможность делать графики по минутам в течение дня. Мы так подробно пока не можем.
- Как производилась разработка индекса агрессивности конкретно в вашей команде?
- Для начала нам нужно было добыть ключевые слова по случайному отбору. Мы взяли комментарии на Delfi за 2010 год и из них сделали выборку по определенной дате каждого месяца, если я не ошибаюсь. Порталы высылают нам все опубликованные комментарии без блокированного спама, а мы уже дальше сортируем.
Компьютер все это сосчитал и разложил в алфавитном порядке, а мы добыли список из 65 тысяч слов. Все слова были сосчитаны в разных склонениях и спряжениях. Лаборатория искусственного интеллекта занималась анализом текста и изобрела приспособления, с помощью которых можно им манипулировать. Специальная программка проходила сквозь огромное количество слов и расставила их в алфавитном порядке.
Господин Седлениекс показывает мне огромный список, где есть даже числа, когда-то употребленные в комментариях, не говоря уже о союзах и предлогах. А если этот список отсортировать по частоте употребления, то можно получить интересные вещи.
Самое популярное слово в латышском списке - государство, на втором месте - Латвия, потом идут - деньги, работа, народ. В русском списке на первое место выходят слова: политический, американский, красивый, Лондон, взятки, граница.
Оказывается, это то, что больше всего заботит наших людей.
- Дальше мы прошли по всему этому списку слов, - продолжает Клавс, - и попытались выяснить, какие из них идентифицируют и показывают агрессивное настроение. Потом сложили эти слова в группы и распределили по категориям.
Категории следующие: 1. Ругательства. 2. Слова, аппелирующие к несправедливости (вор, страдать, преступление, отвратительный, режим). 3. Дискриминация. 4. Призывы к агрессивной деятельности. 5. Агрессивные действия. 6. Персоны (Гитлер, Сталин, Сатана). 7. Ассоциации с чем-либо (чекист, судить, страдать, полиция - так как это властная структура и ассоциируется с насилием). 8. Милитарные термины. 9. Осуждение (плохой, стыд, вор, отвратительный). 10. Агрессивные эмоции (зависть, неудовлетворенный, ненавидеть). 11. Предательство (шпион, стукач).
Затем компьютерный фильтр берет все слова и редуцирует их до основной формы. А дальше уже высчитывает процентуально, сколько каких слов имеется. То есть считает удельный вес агрессивных слов из названных категорий по отношению к остальным нейтральным словам и представляет общие тенденции.
График нам показывает, что в самой высшей точке 5,33% всех слов были агрессивными.
- Это, конечно, маленький процент, - говорит Клавс, - но у нас нет опорного пункта, который бы указывал на то, сколько процентов много, а сколько мало для агрессии.
Оказывается, ругательные слова не так популярны и в первые строчки хит-парада не входят. Но в них есть поджигающий потенциал - они могут спровоцировать других людей на агрессию. Ругательных слов может быть мало, но они как триггеры для дальнейшей ненависти.
Среди агрессивных слов у латышского населения особенно популярны: стыд - он на первом месте, дальше идут война, плохой, полиция, судить, вор, страдать, оружие, бороться.
У русских на первую линию выходят агрессивные война, Майдан, оружие, суд, войско, плохо. У русскоязычных, кстати, побольше и ругательных слов - дурак, идиот, фашист.
Дальше господин Седлениекс, переполненный чувствами, показывает мне довольно забавную вещь.
- Я тут недавно сравнил употребление двух слов, kar и война, в отдельности. И посмотрите, что происходит! У латышей это слово чаще фигурирует в комментариях, нежели у русских. Когда начались события на Украине, у латышских комментаторов началось волнение, у русских все спокойно. То есть весь последний год латыши волновались по этому поводу, тогда как у русских ноль реакции. С июня по сентябрь все время растет напряженность в связи с войной, кривая у латышей волнуется, а у русских почти ровная линия. Загадка.
- А что вас больше всего удивило в исследовании?
- Одна из первых вещей, которую я начал здесь смотреть, - оказывают ли какое-либо влияние месячные фазы. Обычно ведь, когда люди буянят и психуют, их поведение списывают на полнолуние. А я, к своему удивлению, обнаружил, что фазы месяца не оказывают совершенно никакого влияния.
Еще меня удивили некоторые слова. Во время проекта мы с коллегами узнали очень много новых слов, о которых раньше и не слышали. Их значение надо было специально искать в словарях. Всех нас удивило часто повторяющееся загадочное слово пиндосы. Не знали мы и таких слов, как кацап, ахинея, балда. Криминальный жаргон, не знакомый латышской среде, тоже часто появлялся.
- Про пиндосов, конечно, забавно, но как вы считаете, агрессивное у нас в Латвии общество?
- Чтобы точно сказать, нужно сравнивать с чем-то. Я сейчас вам данные по убийствам покажу! - с энтузиазмом отвечает он.
Господин Седлениекс буквально за секунду отыскивает в своем компьютере схему, где сравнивается количество убийств на человека у разных обществ. На этой схеме Латвия находится где-то посередине, не дотягивая, к сожалению, до Скандинавских стран, но, к счастью, далека от высоких показателей Сальвадора.
- За последние десять лет такие показатели в нашей стране намного улучшились, - вселяет в меня оптимизм исследователь людей, - но по сравнению со Скандинавией у нас пока еще другие человеческие ценности.
- Вот смотрите, - уточняет Клавс, - что нас отличает от Норвегии. Помните Брейвика и ответ норвежцев на его преступления? В Осло тогда прошла демонстрация за любовь, дружбу, за то, что их не запугать. А в это же время латвийские порталы носились с идеями, чего бы такого ужасного можно было бы с Брейвиком сделать и как ему побольнее отомстить. Это очень показательно.
Это ведь в нашей стране Комиссию по правам человека возглавлял священник Янис Шмитс, который утверждал, что гомофобия - это одно из его человеческих прав и что любящие родители просто обязаны пороть своих детей.
Я как-то спрашивал у своих студентов, сколько среди них таких, кто ни разу не получал по заднице. И у меня только одна девочка подняла руку и сказала, что ей кажется, что она ни разу не получала от родителей. Нам ведь до сих пор кажется, что порка является составляющей нормального педагогического процесса.
- Какой портал самый агрессивный?
- Это тоже очень интересно. У всех порталов взлеты и падения одинаковы, только у Аполло это на более высоком уровне. Все обычно думают о более агрессивных комментариях на Delfi, так как на Аполло не заходят - он менее популярный, но более агрессивный. Я поизучал их комментарии - у них и ругательств побольше.
- А комментаторы - это одни и те же люди или каждый раз комментируют другие личности?
- Сложно сказать, но в общем это всегда одинаковое количество людей. И можно сказать, что это такая своеобразная условная община, которая там постоянно возится.
- Каково практическое применение у вашего индекса?
- Такой индекс пригодится людям, чья ежедневная работа связана с выявлением общественных настроений. Политики, полиция. Но, насколько мне известно, полиция сама для себя делает что-то похожее. А наш интерес был чисто академическим - возможно ли вообще было это сделать, измерить агрессивность и процессы, которые происходят в обществе. Те же самые порталы могут делать себе мониторинг с помощью нашего индекса и смотреть на последствия своих кричащих заголовков, наблюдать, что они развязали и вызвали.
- А тролли провоцируют?
- Да, но если смотреть в среднем, то очень мало. Я как-то обнаружил отклонения - слова, которые встречаются нетипично часто. То есть картина выглядит не так, как обычно. И оказалось, что похожие комментарии с повторяющимися агрессивными словами были отправлены по нескольку раз, то есть это машина или человек сидит и с умыслом пишет практически одинаковые тексты, для того чтобы разжечь побольше ненависти.
- Есть ли среди известных персон и политиков такие, которые вызывают больше агрессии?
- Я конкретно не изучал, но если брать политиков, то в комментариях они все упоминаются в лишь в негативном контексте.
Клавс набирает в поиске индекса фамилию Страуюма. Я пробегаюсь по комментариям и резюмирую, что все негативные.
- А позитивных вообще не бывает, - смеется Клавс.
Автор: Виктория Стиебре
источник: Вести Сегодня