Може ли профилите във Facebook да измерват личността?

Това е въпрос, който интердисциплинарна група изследователи от университета в Пенсилвания се опитват да отговорят. Понастоящем психолозите използват различни методи, включително анкети и въпросници, които се отчитат самостоятелно, за оценка на личността.
В скорошно проучване 75 000 души доброволно са попълнили общ въпросник за личността чрез приложение на Facebook и са направили актуализациите на статуса си във Facebook достъпни за изследователски цели. След това изследователите потърсиха общи езикови модели в езика на доброволците.
Изследването е публикувано в списанието PLOS ONE.
Изследователите генерираха компютърни модели, които успяха да предскажат възрастта, пола и отговорите на хората на въпросниците за личността, които взеха.
Тези модели за прогнозиране бяха изненадващо точни. Например, изследователите са били правилни 92 процента от времето, когато са предсказвали пола на потребителите само въз основа на езика на актуализациите на статуса им.
Успехът на този „отворен“ подход предлага нови начини за изследване на връзките между личностните черти и поведения и измерване на ефективността на психологическите интервенции.
Изследването на изследователите се основава на дълга история на изучаване на думите, които хората използват като начин за разбиране на своите чувства и психични състояния, но са използвали „отворен“, а не „затворен“ подход за анализ на данните в основата си.
„В подход на„ затворен речник “, каза докторантът Маргарет Керн,„ психолозите може да изберат списък с думи, които според тях сигнализират за положителна емоция, като „доволен“, „ентусиазиран“ или „прекрасен“ и след това погледнете честотата на използването на тези думи от човек като начин да измервате колко щастлив е този човек.
Подходите със затворен речник обаче имат няколко ограничения, включително, че те не винаги измерват това, което възнамеряват да измерват. “
„Например“, каза Унгар, „може да се установи, че енергийният сектор използва повече отрицателни емоционални думи, просто защото те използват думата„ суров “повече. Но това сочи към необходимостта да се използват изрази с много думи, за да се разбере замисленото значение.
„Суровият нефт“ е различен от „суров“ и по същия начин това, че „болен от“ е различно от това просто да бъдеш „болен“. "
Друго присъщо ограничение на подхода на затворения речник е, че той разчита на предварително замислен, фиксиран набор от думи. Подобно проучване може да бъде в състояние да потвърди, че депресираните хора наистина използват по-често очаквани думи (като „тъжен“), но не могат да генерират нови прозрения (че говорят по-малко за спорт или социални дейности, отколкото щастливите хора например).
Миналите психологически езикови проучвания задължително са разчитали на подходи със затворен речник, тъй като малките им размери правят отворените подходи непрактични. Появата на масивни езикови набори от данни, предоставени от социалните медии, сега позволява качествено различни анализи.
„Повечето думи се срещат рядко - всяка проба от писане, включително актуализации на статуса на Facebook, съдържа само малка част от средния речник“, съобщава Х. Андрю Шварц, постдокторант по компютърни и информационни науки.
„Това означава, че за всички, с изключение на най-често срещаните думи, трябва да пишете проби от много хора, за да установите връзки с психологически черти. Традиционните проучвания са открили интересни връзки с предварително избрани категории думи като „положителна емоция“ или „функционални думи“.
Въпреки това, милиардите екземпляри от думи, достъпни в социалните медии, ни позволяват да намерим модели на много по-богато ниво. "
Подходът с отворен речник, напротив, извлича важни думи и фрази от самата проба. С повече от 700 милиона думи, фрази и теми, пробити от извадката от съобщения за състоянието на Facebook на това проучване, имаше достатъчно данни, за да се прекоси стотиците често срещани думи и фрази и да се намери отворен език, който по-значимо корелира със специфични характеристики.
Този голям размер на данните беше от решаващо значение за специфичната техника, която екипът използва, известна като диференциален езиков анализ или DLA.
Изследователите използваха DLA, за да изолират думите и фразите, групирани около различните характеристики, които са докладвани в анкетните карти на доброволците: възраст, пол и резултати за личностните черти на „Голямата петорка“ - екстравертност, съгласие, добросъвестност, невротизъм и откритост.
Моделът на Голямата петорка е избран, тъй като е често срещан и добре проучен начин за количествено определяне на личностните черти, но методът на изследователите може да бъде приложен към модели, които измерват други характеристики, включително депресия или щастие.
За да визуализират резултатите си, изследователите създадоха облаци от думи, които обобщават езика, който статистически предсказва дадена черта, като силата на корелация на думата в даден клъстер се представя от нейния размер. Например облак от думи, който показва езика, използван от екстравертите, на видно място съдържа думи и фрази като „парти“, „страхотна нощ“ и „удари ме“, докато облакът от думи за интроверти съдържа много препратки към японски медии и емотикони.
„Може да изглежда очевидно, че супер екстравертен човек би говорил много за партита - каза Айхщадт, - но взети заедно, тези облаци от думи предоставят безпрецедентен прозорец в психологическия свят на хората с дадена черта. Много неща изглеждат очевидни след факта и всеки елемент има смисъл, но бихте ли помислили за всички или дори за повечето от тях? "
Мартин Селигман, програмен директор обяснява: „Когато се запитам какво е да си екстроверт?“ „Какво е да си тийнейджърка?“ „Какво е да си шизофреник или невротик?“ Или „Какво е да си На 70 години? „Тези облаци от думи се приближават много по-близо до същността на въпроса, отколкото всички съществуващи въпросници.“
За да проверят колко точно те улавят чертите на хората чрез техния подход с отворен речник, изследователите разделят доброволците на две групи и виждат дали статистически модел, извлечен от едната група, може да се използва, за да се извлекат чертите на другата. За три четвърти от доброволците изследователите са използвали техники за машинно обучение, за да изградят модел на думите и фразите, които предсказват отговорите на въпросника.
След това те използваха този модел, за да предскажат възрастта, пола и личностите за останалото тримесечие въз основа на техните публикации във Facebook.
„Моделът беше 92 процента точен при прогнозиране на пола на доброволеца от езиковата им употреба“, каза Шварц, „и можем да предскажем възрастта на човек в рамките на три години повече от половината от времето.
„Предсказанията ни за личността по своята същност са по-малко точни, но са почти толкова добри, колкото използването на анкетни резултати на човек от един ден, за да се предскажат отговорите му на същия въпросник в друг ден.“
С подхода с отворен речник, показан за еднакво или по-предсказуем от затворените подходи, изследователите използваха облаците от думи, за да генерират нови прозрения за връзките между думите и чертите. Например участниците, които са постигнали ниска оценка по невротичната скала (т.е. тези с най-много емоционална стабилност), са използвали по-голям брой думи, отнасящи се до активни, социални занимания, като „сноуборд“, „среща“ или „баскетбол“.
„Това не гарантира, че спортуването ще ви направи по-малко невротични; възможно е невротизмът да кара хората да избягват спорта “, каза Унгар. "Но това предполага, че трябва да проучим възможността невротичните индивиди да станат по-емоционално стабилни, ако спортуват повече."
Изграждайки предсказващ модел на личност, базиран на езика на социалните медии, изследователите вече могат по-лесно да подхождат към такива въпроси. Вместо да се иска от милиони хора да попълват анкети, бъдещи проучвания могат да бъдат проведени, като доброволците изпратят своите Facebook или Twitter емисии за анонимно проучване.
„Изследователите са изследвали тези черти на личността в продължение на много десетилетия теоретично - каза Айхщадт, - но сега те имат прост прозорец към това как те оформят съвременния живот в ерата на Facebook.“
Източник: Университет в Пенсилвания