Мъдростта на (Избраните) тълпи

Все повече компании се възползват от мъдростта на своите клиенти и потребители - много отбрана тълпа. Те правят това чрез „големи данни“ - събират съкровища от анонимни данни и след това извършват post-hoc анализи върху тях.

Това усилие може да доведе до някои интересни прозрения. Това също може да накара компаниите да предполагат, че резултатите са обобщими за цялото население.

И именно този последен проблем е проблемът. Защото, ако започнете със самостоятелно избрана извадка, вашите данни са подходящи само за хора като тях, а не за цялата популация. Това е само един от проблемите с измерването - и предприемането на действия - въз основа на информация от избраните тълпи.

Уебсайтовете правят измервания на „големи данни“ вече близо 20 години. Всеки път, когато посетите уебсайт, той оставя малка следа от данни на сървъра на уебсайта. Собствениците на сървъра вземат тези данни и ги пускат чрез платформа за анализ на данни (като Google Analytics). Той дава на собственика на уебсайта обобщена информация за видовете хора, които посещават техния уебсайт.

Тъй като всеки уебсайт е уникален, такива прозрения са от значение само за този уебсайт. Потребител, който посещава CNN, например, може да има малко общо с потребител, който посещава Match.com.

Проблемът с избора на тълпи

При анализа на данните статистиците наричат ​​такова вземане на проби „самоизбрана извадка“, което води до проблема с „пристрастие към самоизбор“. Просто казано, това означава, че тъй като вашите данни идват само от хора, които използват конкретно приложение или вид социални медии, те не са представителни за населението като цяло. И тъй като не е представителен за популацията като цяло, не можете да обобщавате данните.

Наричам това проблемът „изберете тълпи“. Защото, ако черпите мъдростта си от тълпата, по-добре се уверете, че тълпата е представителна за населението, ако се опитвате да получите обобщителни прозрения от нея.

Има цели компании, които не правят нищо друго, освен да анализират тенденции и данни от Twitter. Но ако погледнете кой използва Twitter - и как го използват - веднага бихте се притеснили какво наистина означават такива данни. Например потребителите на Twitter са много по-млади от общото население, а възрастните хора са силно недостатъчно представени. Ако управлявате компания, която разглежда здравните тенденции в Twitter, ще видите нещо съвсем различно, отколкото ако проведете рандомизирано телефонно проучване.

С други думи, какви тенденции в Twitter могат или нямат значение за 80+ процента от американците, които не използват Twitter.

Приложенията не са по-добри

Приложенията често обичат да събират данните на своите потребители, да ги анонимизират и след това да ги използват, за да сравняват ефективността ви с други, които също използват приложението. Това трябва да ви накара да се почувствате като част от социална мрежа, която има общото приложение. Това е страхотна идея.

Защото какво, ако само определен тип човек използва това конкретно приложение? Какво ще стане, ако само депресираните хора използват приложение за проследяване на настроението, предназначено да помогне да се извадят хората от депресията им, като им помогне да проследят настроенията си, сравнявайки напредъка си с други, които също използват приложението? Такива резултати могат да бъдат неволно потискащи сами по себе си.

Можете ли да мотивирате положително някого чрез социално сравнение? Можете, но твърде често, изследването също така показва, че подобни социални сравнения карат хората да се чувстват по-зле от преди. Трябва да се направи изключително внимателно - нещо, което повечето типични разработчици на приложения не разбират.

Оставяне на важни неща за измерване

Всяко приложение или услуга е толкова добро, колкото нещата, които избере да измери. Можете да въведете пристрастия - умишлено или неволно - в резултатите си от това, което сте избрали да измервате - и не измервате.

Помислете така: мислите да се преместите в нов град с по-малко дъжд, така че гледате само средното годишно количество дъжд за различните градове. Бихте потърсили град като Маями и бихте си помислили: „Знаете ли, не се местя в Маями - валят почти 62 инча годишно дъжд! Сравнете това с оскъдните 37 инча дъжд, който Сиатъл получава. Сиатъл трябва да е по-слънчевото, по-малко дъждовно място. " Тъй като не сте включили други важни показатели в измерването си, ще направите грешен избор въз основа на твърде ограничена информация.

Това, което разработчикът на приложение или уебсайт смята за важно при измерването на нещо, всъщност може да не е толкова важно, колкото нещо, което те са пропуснали. Представете си приложение, което измерва само реакцията ви към лекарствата, но е пропуснало всички останали важни фактори, допринасящи за вашето настроение и лечение.

Лечението не се провежда във вакуум с вас и едно лекарство. Провежда се в богата, сложна екосистема, която може да включва лекарства, но включва и много други важни неща, които правите, за да си помогнете да се възстановите. Може да е колко упражнявате, или не размишлявате, или дни, през които преминавате, без да имате паническа атака, или да сте стресирани за член на семейството или работа.

Накратко, има безброй неща, които трябва да се проследяват от приложения и други добронамерени услуги, но не са. И това дава изкривена перспектива за това как нещо, което се измерва, е свързано с настроението или напредъка на възстановяването. Лечението наистина е важно при лечението на много хора, но може да не е - и често не е - най-важното.

!-- GDPR -->