Туитовете предоставят много данни за общественото здраве
Феноменалният растеж на социалните медии създаде безпрецедентно средство за комуникация. Само Twitter позволява на милиони фенове на социалните медии да коментират със 140 знака или по-малко почти всичко.Ново проучване проучи дали този цифров формат може да се използва за проследяване на важни тенденции в общественото здраве. И според двама компютърни учени от университета „Джон Хопкинс“ туит с една дума е: „Да!“
Д-р. Марк Дредзе и Майкъл Дж. Пол подадоха в компютри 2 милиарда публични туитове, публикувани между май 2009 и октомври 2010 г., след което използваха софтуер за филтриране на 1,5 милиона съобщения, отнасящи се до здравни въпроси. Самоличностите на пищялките не бяха събрани.
„Нашата цел беше да разберем дали публикациите в Twitter могат да бъдат полезен източник на информация за общественото здраве“, каза Дредзе.
„Решихме, че наистина биха могли. В някои случаи вероятно сме научили някои неща, за които дори лекарите на пищялките не са били наясно, като например кои лекарства без рецепта са използвали постерите за лечение на симптомите си у дома. "
Сортирайки тези здравни туитове в електронни „купчини“, Дредзе и Пол разкриха интригуващи модели за алергии, случаи на грип, безсъние, рак, затлъстяване, депресия, болка и други заболявания.
„Има някои тесни проучвания, използващи публикации в Twitter, например за проследяване на грип“, каза Дредзе. „Но доколкото ни е известно, никой никога не е използвал туитове, за да разгледа толкова много здравословни проблеми, колкото ние.“
Дредзе и Пол ще представят пълното си проучване на 18 юли в Барселона, Испания, на Международната конференция за уеблоги и социални медии, спонсорирана от Асоциацията за напредък на изкуствения интелект.
В допълнение към откриването на редица здравословни заболявания в публикациите в Twitter, изследователите успяха да запишат много от лекарствата, които болните пищяли консумираха, благодарение на публикации като: "Трябваше да пусна Benadryl ... алергиите са най-лошите."
Други туитове сочат злоупотреба с лекарства.
„Открихме, че някои хора са написали в Twitter, че пият антибиотици срещу грип“, каза Пол. „Но антибиотиците не действат при грип, който е вирус, и тази практика може да допринесе за нарастващите проблеми с резистентността към антибиотици. Така че тези туитове ни показаха, че там съществуват сериозни медицински заблуди. "
Разбира се, по-голямата част от ежедневните туитове нямат нищо общо с болест. Докато един прост подход би бил да се филтрират думи, които са свързани с болест, като „главоболие“ или „треска“, тази стратегия се проваля при такива туитове като „Високата цена на бензина е главоболие за моя бизнес“ или „Имам случай на треска на Бийбър. Обичайте новата му песен. "
За да намерят свързаните със здравето публикации сред милиардите съобщения в първоначалния им фонд, изследователите от Джон Хопкинс прилагат система за филтриране и категоризация, която са създали. С този инструмент компютрите могат да бъдат научени да пренебрегват фрази, които всъщност не се отнасят до здравето на човек, въпреки че съдържат дума, използвана често в здравен контекст.
След като несвързаните туитове бяха премахнати, останалите резултати дадоха някои изненадващи констатации.
„Когато започнахме, дори не знаех дали хората говорят за алергии в Twitter“, каза Пол. „Но разбрахме, че го правят. И имах едно нещо, което не очаквах: Системата откри два различни вида алергии: типът, който причинява подушване и кихане и този, който причинява кожни обриви и копривна треска. "
В около 200 000 от свързаните със здравето туитове изследователите са успели да се възползват от предоставената от потребителите обществена информация, за да идентифицират състоянието, от което е изпратено съобщението. Това им позволи да проследят някои тенденции по време и място, например когато сезоните на алергии и грип достигнаха връх в различни части на страната.
„Успяхме да видим от туитовете, че сезонът на алергиите е започнал по-рано в по-топлите щати и по-късно в Средния Запад и Североизтока“, каза Дредзе.
Дредзе и Пол вече са започнали разговори с учени в областта на общественото здраве, включително някои, свързани с Джон Хопкинс, които казват, че бъдещите изследвания на туитове могат да разкрият още по-полезни данни, не само за медицинските проблеми на плакатите, но и за общественото възприятие относно болестите, лекарствата и други здравни проблеми.
И все пак Дредзе и Пол предупредиха, че опитът да се измери температурата на нацията чрез анализ на туитове има своите ограничения.
От една страна, повечето потребители на Twitter не коментираха повече от веднъж своето конкретно заболяване, поради което беше трудно да се проследи колко дълго болестта продължава и дали се повтаря. Освен това повечето потребители на Twitter обикновено са млади, което би изключило много възрастни граждани от проучване на общественото здраве. Също така в момента Twitter е доминиран от потребители, които се намират в САЩ, което го прави по-малко полезен за изследвания в други страни.
Въпреки че сайтовете в социалните медии позволяват на потребителите да излагат много лична информация на приятели и непознати, изследванията, базирани на Twitter, може да достигнат само определена дълбочина.
„В нашето проучване - каза Пол, - можем да научим само това, което хората са готови да споделят. Смятаме, че има ограничение за това, което хората са готови да споделят в Twitter. "
Въпреки това, Дредзе казва, че все още има много полезни данни, които да останат от публикациите в Twitter. „Хората, с които съм разговарял, са усетили, че това е наистина интересен инструмент за изследване“, каза той, „и те имат страхотни идеи за това, което биха искали да научат след това от Twitter.“
Източник: Университет Джон Хопкинс