Depresszió súlyosságát becslő beszédalapú modell optimalizálása többféle érzelmi állapotot imitált beszédminták felhasználásával
Napjainkban nem ismerünk a depresszió felismerésére objektív biomarkert. Rengeteg próbálkozás történt már, amiben különböző jellemzőket vizsgáltak (például alacsony szerotonin szint, neurotranszmitter diszfunkció), de az eredmény sosem tűnt elégségesnek. A tudomány így a nem-ivanzív beavatkozást igénylő lehetőségek felé fordult, melyek közül a beszéd alapú diagnosztizáló modellek teljesítenek a legjobban.
Ezen modellek gépi tanuló eljárásokkal működnek, és különböző depressziót leíró súlyossági skálákon (például BDI) képesek a beszélő depressziójának súlyossági szintjét megbecsülni.
Dolgozatomban azt tűztem magam elé célnak, hogy megvizsgáljam, mennyire becsaphatóak a modellek, továbbá, hogy (amennyiben szükséges) optimalizáljam ezek működését.
Ezt a feladatot 4 fő részre bontottam. A témához kapcsolódó szakirodalom feltárása, saját (imitációs) beszédadatbázis elkészítése magyar színészeket bevonva, az adatbázis kiértékelése létező modellekkel, és saját (optimalizált) modell fejlesztése.
szerző
-
Dalotti Ágoston
Villamosmérnöki szak, alapképzés
alapképzés (BA/BSc)
konzulens
-
Kiss Gábor
PHD hallgató, Távközlési és Mesterséges Intelligencia Tanszék