В разработка: смартфони, които могат да оценят настроението

Изследователи от университета в Рочестър разработват нова компютърна програма, която измерва човешките чувства чрез реч, с вече създадено прототипно приложение за смартфони.

Програмата не анализира какво казва човек, а по-скоро как.

„Всъщност използвахме записи на актьори, които четат датата на месеца - наистина няма значение какво казват, а как те го казват, което ни интересува“, каза Уенди Хайнцелман, д-р, професор на електротехниката и компютърната техника.

Програмата анализира 12 характеристики на речта, като височина и сила на звука, за да идентифицира една от шестте емоции от звукозапис. Изследователите казват, че то постига 81 процента точност, значително подобрение в сравнение с по-ранни проучвания, които са постигнали само около 55 процента точност.

Изследването вече е използвано за разработване на прототип на приложение, което показва или весело, или тъжно лице, след като записва и анализира гласа на потребителя. Той е построен от един от завършилите студенти на Хайнцелман, На Ян, по време на летен стаж в Microsoft Research.

„Изследването все още е в ранните си дни“, призна Хайнцелман, „но е лесно да си представим по-сложно приложение, което може да използва тази технология за всичко, от регулиране на цветовете, показвани на вашия мобилен телефон (телефон) до възпроизвеждане на музика, подходяща за начина, по който чувстваш се след записа на гласа си. "

Хайнцелман и нейният екип си сътрудничат с психолозите от Рочестър д-р. Мелиса Стърдж-Епъл и Патрик Дейвис, които в момента изучават взаимодействията между тийнейджърите и техните родители. „Надеждният начин за категоризиране на емоциите може да бъде много полезен в нашето изследване“, каза Стърдж-Apple. „Това би означавало, че изследователят не трябва да слуша разговорите и да въвежда ръчно емоциите на различни хора на различни етапи.“

Преподаването на компютър за разбиране на емоциите започва с разпознаване как хората го правят, според изследователите.

„Може да чуете някой да говори и да си мисли„ о, той звучи ядосан. “Но какво ви кара да мислите така?“ каза Стърдж-Apple.

Тя обясни, че емоцията влияе върху начина, по който хората говорят, като променя силата на звука, височината и дори хармониците на речта си. „Ние не обръщаме внимание на тези функции поотделно, току-що дойдохме да научим как звучи гневно - особено за хората, които познаваме“, добави тя.

Но за да може един компютър да категоризира емоциите, той трябва да работи с измерими величини. Така изследователите установяват 12 специфични характеристики в речта, които се измерват във всеки запис на кратки интервали. След това изследователите категоризираха всеки от записите и ги използваха, за да научат компютърната програма на това как звучат „тъжни“, „щастливи“, „страшни“, „отвратени“ или „неутрални“.

След това системата анализира нови записи и се опитва да определи дали гласът в записа изобразява някоя от известните емоции. Ако компютърната програма не беше в състояние да реши между две или повече емоции, тя просто остави този запис некласифициран.

„Искаме да сме уверени, че когато компютърът смята, че записаната реч отразява определена емоция, е много вероятно тя наистина да изобразява тази емоция“, каза Хайнцелман.

Предишни изследвания показват, че системите за класификация на емоциите са силно зависими от говорителите, което означава, че те работят много по-добре, ако системата е обучена от същия глас, който ще анализира. „Това не е идеално за ситуация, в която искате да можете просто да проведете експеримент върху група хора, които говорят и си взаимодействат, като родителите и тийнейджърите, с които работим“, каза Стърдж-Apple.

Новите резултати потвърждават тази констатация. Ако класификацията на емоциите, базирана на речта, се използва за глас, различен от този, който е обучил системата, точността е спаднала от 81 процента на около 30 процента. Сега изследователите търсят начини за минимизиране на този ефект чрез обучение на системата с глас в същата възрастова група и от същия пол.

„Все още има предизвикателства, които трябва да бъдат разрешени, ако искаме да използваме тази система в среда, наподобяваща реална ситуация, но знаем, че разработеният от нас алгоритъм е по-ефективен от предишни опити“, каза Хайнцелман.

Източник: Университет в Рочестър

!-- GDPR -->