Ново гласово приложение може да помогне за контрол на теглото
Основен наемател на загуба на тегло е да преброи всяка консумирана калория. Въпреки че задачата звучи лесно, документирането на всички калории се превръща в трудна задача, когато вечеряте в ресторант, закусвате в движение или дори когато седнете за хранене у дома.
Техниката изисква последователност и точност и когато се провали, обикновено това е така, защото хората нямат време или средства да намерят и запишат цялата информация, от която се нуждаят.
Сега изследователи от Масачузетския технологичен институт (MIT) са разработили приложение, което позволява на хората да влизат в храната и напитките, които са консумирали, използвайки система с речево управление.
Концепцията се появи преди няколко години, когато екип от специалисти по хранене от университета Тъфтс се обърна към изследователите от Масачузетския технологичен институт с идеята за приложение на говорим език, което да улесни регистрирането на храната.
Тази седмица, на Международната конференция по акустика, реч и обработка на сигнали в Шанхай, изследователите от MIT представят своя уеб-базиран прототип на система за регистриране на храненето, контролирана с реч.
С него потребителят описва словесно съдържанието на хранене, а системата анализира описанието и автоматично извлича съответните хранителни данни от онлайн база данни, поддържана от Министерството на земеделието на САЩ (USDA).
Данните се показват заедно с изображения на съответните храни и падащи менюта, които позволяват на потребителя да прецизира техните описания - като избира, например, точни количества храна. Но тези усъвършенствания могат да бъдат направени и устно.
Потребител, който започва с думите: „За закуска имах купичка овесени ядки, банани и чаша портокалов сок“, след което може да направи изменението „Имах половин банан“ и системата ще актуализира данните, които показва за бананите, докато останалите остават непроменени.
„Това, което [диетолозите на Tufts] са изпитали, е, че приложенията, които бяха там, за да помогнат на хората да се опитат да регистрират ястията, бяха малко досадни и следователно хората не успяваха да ги поддържат“, казва Джеймс Глас, старши изследовател .
„Така че те търсеха начини, които да са точни и лесни за въвеждане на информация.“
Първият автор на новия доклад е Манди Корпусик, студент по електротехника и компютърни науки в Масачузетския технологичен институт. Към нея се присъединява Глас, който е нейният дисертант; колегата й аспирант Майкъл Прайс; и от Калвин Хуанг, студент-изследовател в групата на Glass.
В статията изследователите отчитат резултатите от експерименти със система за разпознаване на реч, която са разработили специално за обработка на свързаната с храната терминология.
Това обаче не беше основният фокус на тяхната работа, тъй като онлайн демонстрацията на тяхната система за регистриране на хранене използва вместо това безплатното приложение за разпознаване на реч на Google.
Изследванията им се концентрираха върху два други проблема. Едната е идентифицирането на функционалната роля на думите: Системата трябва да разпознае, че ако потребителят запише фразата „купа с овесени ядки“, хранителната информация за овесените ядки е уместна, но ако фразата е „бисквитка с овесени ядки“, това не е така.
Другият проблем е съгласуването на фразата на потребителя със записите в базата данни USDA. Например данните на USDA за овесените ядки се записват под заглавието „овес“; думата „овесена каша“ не се показва никъде в записа.
За да се справят с първия проблем, изследователите са използвали машинно обучение.
Чрез платформата за краудсорсинг на Amazon Mechanical Turk те наемат работници, които просто описват какво са яли на последните ястия. След това те обозначиха съответните думи в описанието като имена на храни, количества, търговски марки или модификатори на имената на храните.
В „купа с овесени ядки“ „купа“ е количество, а „овесена каша“ е храна, но в „бисквитка с овесени ядки“ овесената каша е модификатор.
След като имаха приблизително 10 000 етикетирани описания на ястия, изследователите използваха алгоритми за машинно обучение, за да намерят модели в синтактичните връзки между думите, които биха идентифицирали техните функционални роли.
След това изследователите използваха база данни с отворен код, наречена Freebase, за превод между описанията на потребителите и етикетите в базата данни USDA. Самата база данни съдържа записи за над 8000 често срещани хранителни стоки, много от които включват синоними.
Там, където липсваха синоними, те отново набираха работници от „Механичен тюрк“, които да ги снабдяват.
Версията на системата, представена на конференцията, е предназначена главно да демонстрира жизнеспособността на своя подход към обработката на естествен език. Системата отчита броя на калориите, но все още не ги прави автоматично.
Версия, която има, обаче е в процес на разработка и когато приключи, изследователите от Tufts планират да проведат потребителско проучване, за да определят дали наистина улеснява регистрирането на храненето.
Източник: MIT