Как да разберем кои туитове са достоверни

Изследователи от Технологичния институт в Джорджия са разработили нов езиков модел, показващ кои думи и фрази влияят положително или отрицателно на достоверността на световните събития, съобщени в Twitter.

Проучването, което сканира 66 милиона туитове относно почти 1400 реални събития, предполага, че думите на милиони хора в социалните медии могат да предложат значителна информация за достоверността на дадено събитие, дори когато събитието все още е в ход.

„През последните години имаше много проучвания за доверието в социалните медии, но много малко се знае за това какви типове думи или фрази създават представа за достоверност по време на бързо разгръщащи се събития“, каза Танушри Митра, доктор по технически науки в Джорджия. кандидат, ръководил изследването.

Екипът изучава туитове относно световни събития през 2014 и 2015 г., включително появата на ебола в Западна Африка, атаката на Charlie Hebdo в Париж и смъртта на Ерик Гарнър в Ню Йорк.

Изследователите помолиха хората да преценят постовете според тяхната достоверност (от „със сигурност точни“ до „със сигурност неточни“). След това екипът подаде думите в модел, който ги раздели на 15 различни езикови категории. Класификациите включват положителни и отрицателни емоции, жив плет и бустери и безпокойство.

След това компютърът на Georgia Tech изследва думите, за да прецени дали туитовете са достоверни или не. Той съответства на мненията на хората около 68% от случаите, процент значително по-висок от случайното изходно ниво от 25%.

„Туитовете с бустерни думи, като„ неоспорим “и положителни емоционални термини, като„ нетърпелив “и„ страхотен “, бяха разглеждани като много достоверни“, каза Митра. „Думите, показващи позитивни настроения, но подиграващи непрактичността на събитието, като„ ха “,„ усмивки “или„ шегуване “, бяха възприети като по-малко достоверни. Както и думите за хеджиране, включително „определено ниво“ и „заподозрени“. “

По-голям брой ретуити са свързани с по-ниски оценки на достоверността.Считаше се, че отговорите и ретуитите с по-голяма дължина на съобщенията са по-достоверни.

„Възможно е по-дългите дължини на съобщенията да предоставят повече информация или разсъждения, така че те се разглеждат като по-надеждни“, каза тя. „От друга страна, по-голям брой ретуити, които са оценени по-ниско по отношение на достоверността, може да представлява опит за извличане на колективни разсъждения по време на криза или несигурност.“

Въпреки че моделът все още не може да се използва, изследователите казват, че в крайна сметка могат да разработят приложение, което може да изчисли възприеманата надеждност на дадено събитие, докато се разгръща в социалните медии.

„В комбинация с други сигнали, като теми за събития или структурна информация, нашият лингвистичен резултат може да бъде важен градивен елемент на автоматизирана система“, каза д-р Ерик Гилбърт, съветник на Митра и асистент в Училището за интерактивни изчисления в Джорджия Тех.

„Twitter е част от проблема с разпространението на неверни новини онлайн. Но може да бъде и част от решението. "

Източник: Технологичен институт в Джорджия

!-- GDPR -->