Големи данни: Можем ли да прогнозираме тенденции на населението (като щастие) чрез Health Apps?
Преди повече от пет години написах статия, озаглавена "Надеждност и валидност в света на Web 2.0". Той говори за опасенията при събирането на данни от пристрастни извадки - без първо да се разбере по какъв начин точно тези извадки могат да бъдат пристрастни.Сега, с повсеместното приложение - програми за изтегляне за смартфони на хората - виждам да възниква същия проблем. Разработчиците и предприемачите търсят данни от тези приложения, без да разбират основите на доброто, надеждно и научно събиране на данни. И защо има значение - особено когато започнете да искате да анализирате всички тези „големи данни“ (малко глупав термин ... например в епидемиологията, учените просто го наричат „данни“).
Могат ли личните здравни данни да се събират от тези приложения без пристрастия и по някакъв начин да се трансформират в измерване на нещо по-голямо?
Кратък отговор: не, не е лесно.
Разбира се, има хора, които са част от движение „количествено определено„ Аз “- които искат да проследяват и измерват всеки аспект от своето лично здраве (и предполага се, психично здраве). Но тези хора понастоящем са1 отстъпници и по никакъв начин не представляват населението като цяло.
Такива малцинства могат бързо да направят по-голямата част от усилията за събиране на по-големи масиви от данни, за да анализират тенденциите в здравето или благосъстоянието. Макар получените анализи да могат да ви кажат нещо за тази група хора, би било неподходящо да се предположи, че тя се обобщава за останалата част от населението (които, демографски и поведенчески, могат да изглеждат и действат съвсем различно).
Това няма да се промени скоро, защото повечето здравни приложения се изтеглят от хората, използват се веднъж или два пъти и след това се изоставят. Има причина повечето хора да спрат да използват здравни приложения - особено такива, предназначени да действат като дневник за данни. Те са скучни! Събирането на данни за себе си е просто много скучна задача за повечето от нас да се ангажират да правят активно всеки ден (или дори всяка седмица).
Сложният отговор: Приложенията трябва да бъдат по-умни, свързани
Приложенията за здраве, предназначени да събират данни, в крайна сметка се провалят, защото изискват активно въвеждане от потребителя. Ето защо личните здравни досиета до голяма степен никога не са излизали по някакъв смислен начин.2 Хората са твърде заети да живеят живота си, за да се притесняват да казват на приложение3 какви са техните дневни показатели.
За да успеят в крайна сметка приложенията за здраве, когато повечето други опити за софтуер за лично проследяване на здравето са неуспешни, те трябва да събират пасивно данните си. Това означава, че не се изисква въвеждане от потребителя.
Разбира се, ние сме далеч от такива показатели, които предоставят значими данни.Разбира се, има работещи устройства, които проследяват колко тичате (от Nike, разбира се). Но работещото приложение е безполезно, ако не говори с приложението ми за диета, приложението ми за хранене или приложението ми за упражнения. Или приложението ми за внимание. Това е едно приложение, измерващо един показател в сложното същество, което съм аз. Просто не е много да продължавам.
Доверието е ключов крайъгълен камък
Приемането на такива мрежови приложения, споделящи всички ваши здравни данни, има и друго, по-малко техническо, препятствие - доверието. Компании като Facebook и Nike в крайна сметка отговарят само на един набор от хора - техните акционери. Това означава, че ако е в техен интерес да анализират вашите данни за неща, от които могат да спечелят пари, те ще го направят.
Стартъпите не са по-добри, защото вместо акционери, те отговарят само на рисковите капиталисти - заемодатели, които търсят само най-добрата и бърза възвръщаемост на инвестицията си.
Защо бих искал да се доверя на здравната си информация - данни, които биха могли да се използват срещу мен за бъдещо отказване от застраховка или определяне на моите застрахователни ставки - на компании, които имат малък интерес да защитят личния ми живот?
Което ни връща отново към първата точка - предубедена извадка. Хората, които с удоволствие дават цялата си здравна информация на компании с нестопанска цел, за да анализират, съпоставят и в крайна сметка се свързват с вас (дори ако тези данни първоначално са анонимизирани), не са като повечето хора. Повечето от нас все още се грижат да запазват здравната си информация за себе си, точно както повечето от нас все още искат да запазят финансовата си информация за себе си.
Къде отиваме от тук
Опитът за събиране на базирани на населението данни (напр. Провеждане на епидемиологични изследвания) от здравни приложения има някои проблеми и възможности, които установих:
- Предварително вземане на проби поради малкото малцинство от хора, които активно и непрекъснато използват здравни приложения
- Вземането на проби и продължителната употреба могат да бъдат подобрени от пасивен срещу активен събиране на данни
- Вземането на проби и използването може да бъде допълнително подобрено чрез използване на надежден орган за събиране и съхраняване на данни (не на компания с печалба или стартиране)
- Приложенията, които са наясно един с друг и обменят подходящи здравни данни за мен, са следващото поколение - вместо сегашното богатство на затворени, непознати (глупави?) Приложения
Мисля, че е чудесно разработчиците да разгледат здравословен проблем, да разработят приложение за него и да го пуснат по света. Но твърде често тези приложения не отиват никъде, без публика. Или са осиротели от първоначалните разработчици поради липса на интерес. Няколко популярни здравни приложения, които печелят стабилна аудитория, са изключение, а не правило. И дори когато получат широко признание, точно като електронните системи за медицинска документация в нашата страна, те не говорят помежду си.
Ако искате да можете да кажете нещо авторитетно или смислено за данните, събрани от приложение, трябва да покажете, че данните идват от представителна извадка от популацията. Липсвайки това, вашите данни ни казват само за една малка група от популацията - тази, която не прилича на повечето от нас.
Бележки под линия:
- И ще бъде в обозримо бъдеще [↩]
- И защо Google най-накрая ще закрие собствения си здравен запис утре. [↩]
- Или по-лошо - и по-често - а цял набор от приложения които не са наясно с друг и не могат да обменят данни помежду си [↩]