Kamerafelvétel alapú távolságbecslés mély neurális hálóval
Az elmúlt évek egyik legnagyobb szoftvermérnöki kihívása egy olyan önvezető rendszer megalkotása, amely képes bármely közlekedési szituációban önállóan helyes döntést hozni (ötös szintú autonómia). A technológia jelen állása lehetővé teszi a részben önvezető rendszerek meglétét a már utcán közlekedő autókban (kettes szintű autonómia). Jelenleg úgy tűnik, hogy az önvezetéshez használatos szenzorok képességei és a feldolgozáshoz szükséges nagy számítási igény lehetővé tennék egy ötös szintnek megfelelő önvezető rendszer megalkotását, de a probléma bonyolultságából kifolyóan nem lehet klasszikus algoritmusokkal elvégezni ezt a feladatot.
Az utóbbi évtizedben sokat fejlődött a machine learning terület deep learning iránya, amely lehetővé teszi olyan kép és egyéb szenzoradatok feldolgozását, ami nagyban elősegítheti egy magasabb szintű önvezető rendszer létrejöttét.
A különböző szenzoradatok feldolgozásáért egy mély neurális háló a felelős, amely több, különböző részfeladatot old meg egyszerre (multitask learning). Ilyen részfeladatok az objektumdetekció, a sávok észlelése, vagy éppen a kereszteződés helyének és a közlekedési lámpa állapotának megállapítása. Egyes részfeladatok együttes tanítása hatékonyabb lehet és jobb teljesítményt produkálhat, mintha ezeket a feladatokat külön-külön neurális hálóval oldottuk volna meg.
Dolgozatomban egy bizonyos részfeladat, a távolságbecslés problémakörét és annak megvalósítását vizsgálom, mégpedig kizárólag kameraszenzorok segítségével. Célom egy olyan neurális háló tanítása volt, amely képes a képen látható egyes pixelekhez távolságértékeket rendelni. Továbbá előállok egy saját ötleten alapuló hibafüggvénnyel, mégpedig a távolságértékek hibájának számításakor figyelembe veszem a rendelkezésre álló szemantikus szegmentációt is. Ennek célja, hogy egyes objektumok, mint például az autók és gyalogosok, amik a kép csupán egy kis részét alkotják, nagyobb súllyal szerepeljenek a hibaszámításba, így ellensúlyozva az aránylag kis méretüket.
szerző
-
Füleki Fábián
Mérnök informatikus szak, alapképzés
alapképzés (BA/BSc)
konzulensek
-
Dr. Gyires-Tóth Bálint
adjunktus, Távközlési és Mesterséges Intelligencia Tanszék -
Kabai Róbert Zsolt
Deep Learning for Point Cloud Team Lead, Continental (külső)