Намиране на недостатъци в изследванията на социалните медии

Изследователите трябва да бъдат предпазливи от сериозни клопки при работата с огромни масиви от данни в социалните медии, според компютърните учени от университета Макгил в Монреал и университета Карнеги Мелън в Питсбърг.

Неправилните резултати могат да имат огромни последици: Хиляди научни статии всяка година се основават на данни, получени от социалните медии.

„Много от тези документи се използват за информиране и обосноваване на решения и инвестиции сред обществеността, както и в индустрията и правителството“, каза д-р Дерек Рутс, асистент в Училището по компютърни науки на McGill’s.

За поведенческите учени растежът на социалните медии изглежда безпрецедентна възможност за улавяне и след това за анализ на обилно количество информация за човешкото поведение.

Много учени вярват, че такива узрели набори от данни могат да помогнат да се предскаже човешкото поведение на ниво, което никога досега не е било представено. През последните години проучванията твърдят, че е възможно да се предвиди всичко - от летните блокбъстъри до колебанията на фондовия пазар.

Но в статия, публикувана в списанието Наука, Рутс и д-р Юрген Пфефер от Института за софтуерни изследвания на Карнеги Мелън изтъкват няколко проблема, свързани с използването на набори от данни в социалните медии, заедно със стратегии за тяхното справяне. Сред предизвикателствата:

  • Различните социални медийни платформи привличат различни потребители - Pinterest, например, е доминиран от жени на възраст между 25 и 34 години - но изследователите рядко поправят изкривената картина, която тези популации могат да създадат;
  • Публично достъпните емисии с данни, използвани в изследванията на социалните медии, не винаги осигуряват точно представяне на общите данни на платформата - и изследователите обикновено са в тъмнина относно това кога и как доставчиците на социални медии филтрират своите потоци от данни;
  • Дизайнът на платформите за социални медии може да диктува поведението на потребителите и следователно какво поведение може да бъде измерено. Например, във Facebook липсата на бутон „нехаресване“ прави отрицателните отговори на съдържание по-трудни за откриване, отколкото положителните „харесвания“;
  • Голям брой спамери и ботове, които се представят за нормални потребители в социалните медии, погрешно се включват в много измервания и прогнози за човешкото поведение;
  • Изследователите често докладват резултати за групи от лесни за класифициране потребители, теми и събития, което прави новите методи да изглеждат по-точни, отколкото са в действителност. Например, усилията да се направи извод за политическата ориентация на потребителите на Twitter постигат едва 65 процента точност за типичните потребители - въпреки че проучванията (фокусирани върху политически активни потребители) твърдят 90 процента точност. Потребителите на Twitter постигат едва 65 процента точност за типичните потребители - въпреки че проучванията (съсредоточени върху политически активни потребители) са заявили 90 процента точност.

Изследователите казват, че много от проблемите са общи и за други области като епидемиологията, статистиката и машинното обучение.

„Общата нишка във всички тези проблеми е необходимостта изследователите да са по-наясно с това, което всъщност анализират, когато работят с данни в социалните медии“, казва Рутс.

Социалните учени са усъвършенствали своите техники и стандарти, за да се справят с този вид предизвикателства и преди.

„Прословутото заглавие„ Дюи побеждава Труман “от 1948 г. произтича от телефонни проучвания, в които подборниците на Труман са взели под извадка сред общата популация“, отбелязва Рутс.

„Вместо да дискредитира трайно практиката на анкетиране, тази явна грешка доведе до днешните по-сложни техники, по-високи стандарти и по-точни анкети. Сега сме готови за подобна технологична точка на прегъване. Справяйки се с проблемите, с които се сблъскваме, ще можем да реализираме огромния потенциал за добро, обещан от изследванията, базирани в социалните медии. "

Източник: Университет Макгил

!-- GDPR -->