Машинното обучение може да помогне да се предскаже психоза чрез езиков анализ
Нов метод за машинно обучение може да предскаже с 93 процента точност дали човек с риск от психоза ще продължи да развива разстройството.
Методът, разработен от учени от университета Емори и Харвардския университет, открива, че по-високото от нормалното използване на думи, свързани със звука, съчетано с по-висок процент на използване на думи с подобно значение, означава, че психозата вероятно е на хоризонта.
Дори обучени клиницисти не бяха забелязали как хората в риск от психоза използват повече думи, свързани със звук, отколкото средното, въпреки че ненормалното слухово възприятие е ранен предупредителен знак.
„Опитът да чуеш тези тънкости в разговорите с хора е като да се опитваш да видиш микроскопични микроби с очите си“, казва Негине Резаи, първи автор на статията. „Автоматизираната техника, която разработихме, е наистина чувствителен инструмент за откриване на тези скрити модели. Това е като микроскоп за предупредителни признаци на психоза. "
Началото на шизофрения и други психотични разстройства обикновено се случва в началото на 20-те години, като ранните предупредителни признаци - известни като продромален синдром - започват около 17-годишна възраст. Около 25 до 30 процента от младите хора с продромален синдром в крайна сметка ще развият шизофрения или друго психотично разстройство.
Понастоящем няма лечение за психоза. Чрез структурирани интервюта и когнитивни тестове, обучени клиницисти могат да предскажат психоза с около 80 процента точност при тези с продромален синдром.
Сега изследванията с машинно обучение, форма на изкуствен интелект, която може да разкрие скрити модели, е едно от многото текущи усилия за рационализиране на диагностичните методи, идентифициране на нови променливи и подобряване на точността на прогнозите.
„По-рано беше известно, че фините черти на бъдещата психоза присъстват в езика на хората, но ние използвахме машинно обучение, за да разкрием всъщност скрити подробности за тези характеристики“, казва старшият автор Филип Волф, професор по психология в Emory. Лабораторията на Wolff се фокусира върху езиковата семантика и машинното обучение, за да предскаже вземането на решения и психичното здраве.
За изследването изследователите първо използваха машинно обучение, за да установят „норми“ за разговорния език. Те хранеха компютърна софтуерна програма с онлайн разговорите на 30 000 потребители на Reddit, социална медийна платформа, където хората водят неформални дискусии за редица теми.
Софтуерната програма, известна като Word2Vec, използва алгоритъм за промяна на отделни думи във вектори (математически термин, отнасящ се до позицията на една точка в пространството спрямо друга). С други думи, програмата присвоява всяка дума на място в семантично пространство въз основа на нейното значение. Думите с подобно значение бяха разположени по-близо една до друга от тези с много различни значения.
Лабораторията на Wolff също така разработи компютърна програма за извършване на „разопаковане на вектори“ или анализ на семантичната плътност на употребата на думи. Разопаковането на вектор позволи на изследователите да определят количествено колко информация е опаковано във всяко изречение.
След генериране на изходно ниво на „нормални“ данни, изследователите прилагат същите техники за диагностични интервюта на 40 млади хора с висок риск от психоза. След това автоматизираните анализи на пробите участници бяха сравнени с нормалната изходна проба.
Резултатите показаха, че по-високото от нормалното използване на звукови думи, заедно с по-високата честота на използване на думи с подобно значение, означава, че е вероятно да възникне психоза.
Силните страни на изследването включват простотата на използването само на две променливи - и двете имат силна теоретична основа - репликацията на резултатите в набор от данни за задържане и високата точност на неговите прогнози, над 90 процента.
„В клиничната сфера често ни липсва точност“, казва Резай. „Нуждаем се от повече количествени, обективни начини за измерване на фини променливи, като тези, скрити в езиковата употреба.“
Rezaii и Wolff сега събират по-големи набори от данни и тестват приложението на техните методи за различни невропсихични заболявания, включително деменция.
„Това изследване е интересно не само заради потенциала си да разкрие повече за психичните заболявания, но и за разбирането на това как работи умът - как събира идеите“, казва Волф. „Технологията за машинно обучение напредва толкова бързо, че ни дава инструменти за извличане на данни от човешкия ум.“
Съавторът Илейн Уокър, професор по психология и неврология на Емори, казва: „Ако успеем да идентифицираме лица, които са изложени на риск по-рано и използваме превантивни интервенции, може да успеем да обърнем дефицитите“.
Констатациите са публикувани в списанието npj шизофрения.
Източник: Emory Health Sciences