arvutiteaduse instituudi lõputööderegister


Reaalajas 3D objektituvastus punktipilvedes
Nimi Enes Özipek
Kokkuvõte Isejuhtivad autod vajavad täpseid ja kiireid objektituvastuse meetodeid. Kaamerapõhises 2D objektituvastuses on tehtud suuri edusamme tänu konvolutsiooniliste närvivõrkude kasutuselevõtule, samas kui samaväärsete tulemuste saavutamine 3D modaalsustes, nagu näiteks punktipilved, on seni jäänud kättesaamatuks. Põhiliseks põhjuseks on, et punktipilved on kolmemõõtmelised ja hõredad, samas kui kaamera pildid on kahemõõtmelised
ja tihedad. Varasemalt on katsetatud 3D konvolutsioonide kasutamist punktipilvedel või punktipilve konverteerimist 2D ülevalt-alla vaateks, millele rakendatakse tavalist 2D konvolutsioonilist võrku. Siiski ei ole need saavutanud soovitud tulemusi. PointPillars on üks hiljuti välja pakutud närvivõrgu arhitektuuridest, mis saavutas punktipilvede peal hea kiiruse ning täpsuse. Selle põhiline eelis tuleneb viisist, kuidas see esitab punktipilve. Kogu punktipilv jagatakse ruudustikuks, mis koosneb vertikaalsetest
"sammastest". Iga sammas kodeeritakse PointNeti abiga ruumiliseks vektoresituseks. Sellele ruudustikule rakendatakse kaasaegset 2D objektituvastuse võrku. Kuigi selline lähenemine esitab punktide omavahelisi asukohti ühe samba sees, siis ei võimalda see käsitleda sambaid erinevalt sõltuvalt nende asukohast. See võib olla vajalik, sest punktipilve tihedus väheneb lidarist kaugemal ja seetõttu on vajadus töödelda kaugemaid
sambaid erinevalt.
Selles töös püütakse PointPillars võrku parendada tuues sisse asukoha kodeeringu konvolutsioonilistes kihtides ja laiendades tuvastuspiirkonda. Asukoha kodeering võimaldab konvolutsioonilistel filtritel olla teadlik, millises kohas neid rakendatakse. Selleks lisatakse konvolutsioonilise ja dekonvolutsioonilise kihi sisendisse kaks täiendavat asukoha kanalit. Töös võrreldakse ka erinevaid asukoha kodeerimise skeeme. Täiendavalt pakutakse välja lihtne skeem võrgu treenimiseks 360-kraadi ulatuses tuvastuseks kui
objektid on märgendatud on ainult kaamera nähtavusulatuses.
Asukoha kodeeringu kasutamine parandas PointPillars võrgu tulemusi, jättes kiiruse praktiliselt samaks. Kuigi 360-kraadine objektituvastus on loomulik lidari jaoks, siis selleks treenitud võrk andis kahjuks palju vale-positiivseid tulemusi.
Lõputöö keel inglise
Lõputöö tüüp Magister - Informaatika
Juhendaja(d) Tambet Matiisen
Kaitsmise aasta 2020
PDF