Kuidas määratleda täielikku autonoomset juhtimissüsteemi?
Kõige tavalisem määratlus on see, et "otsast lõpuni" süsteem on süsteem, mis sisestab andurite töötlemata teabe ja väljastab otse ülesandega seotud muutujad. Näiteks pildituvastuses võib CNN-i nimetada "otsast lõpuni" võrreldes traditsioonilise funktsiooni + klassifikaatori meetodiga.
Autonoomsete sõiduülesannete puhul sisestatakse erinevate andurite (nt kaamerad, LiDAR, Radar või IMU...) andmed ja sõiduki juhtsignaalid (nt gaasihoob või rooli nurk) väljastatakse otse. Erinevate sõidukimudelite kohanemisprobleemide arvessevõtmiseks saab väljundit ka sõiduki sõidutrajektoorile kohandada.
Sellele alusele on tekkinud ka modulaarsed otsast lõpuni kontseptsioonid, nagu UniAD, mis parandavad jõudlust, juurutades lisaks lõppväljundi juhtsignaalidele või teekonnapunktidele ka asjakohaste vaheülesannete järelevalve. Nii kitsast definitsioonist lähtudes peaks aga ots-otsa olemuseks olema sensoorse informatsiooni kadudeta edastamine.
Vaatame esmalt üle sensori- ja PnC-moodulite vahelised liidesed mitte-ots-ots-süsteemides. Tavaliselt tuvastame valgesse nimekirja kantud objekte (nagu autod, inimesed jne) ning analüüsime ja ennustame nende omadusi. Samuti õpime tundma staatilist keskkonda (nagu tee struktuur, kiiruspiirangud, foorid jne). Kui oleksime detailsemad, avastaksime ka universaalseid takistusi. Lühidalt, nende tajude kaudu väljastatav teave moodustab keerukate sõidustseenide kuvamudeli.
Mõne väga ilmse stseeni puhul ei suuda praegune selgesõnaline abstraktsioon aga täielikult kirjeldada tegureid, mis mõjutavad stseenis juhtimiskäitumist, või ülesanded, mida peame määratlema, on liiga triviaalsed ja kõiki vajalikke ülesandeid on raske loetleda. Seetõttu pakuvad täielikud süsteemid (võib-olla kaudselt) kõikehõlmavat esitust, lootes selle teabega PnC-dele automaatselt ja kadudeta tegutseda. Minu arvates võib kõiki süsteeme, mis suudavad seda nõuet täita, nimetada üldistatuks otsast lõpuni.
Mis puutub muudesse probleemidesse, näiteks dünaamiliste interaktsioonide stsenaariumide optimeerimisse, siis usun, et vähemalt ei saa neid probleeme lahendada mitte ainult ots-ots-otsaga, ja otsast lõpuni ei pruugi olla parim lahendus. Traditsioonilised meetodid võivad neid probleeme lahendada ja muidugi, kui andmemaht on piisavalt suur, võib otsast lõpuni pakkuda paremat lahendust.
Mõned arusaamatused autonoomse otsast lõpuni sõitmise kohta
1. Juhtsignaalid ja teekonnapunktid peavad olema otsast lõpuni väljastatud.
Kui nõustute ülalkirjeldatud laiaulatusliku kontseptsiooniga, on seda probleemi lihtne mõista. End-to-end peaks rõhutama teabe kadudeta edastamist, mitte ülesande mahu otse väljastamist. Kitsas otsast lõpuni lähenemine põhjustab palju tarbetuid probleeme ja nõuab ohutuse tagamiseks palju varjatud lahendusi.
2. Otsast lõpuni süsteem peab põhinema suurtel mudelitel või puhtal visioonil.
Täieliku autonoomse sõidu, suure mudeli autonoomse sõidu ja puht visuaalse autonoomse sõidu vahel puudub vajalik seos, sest need on täiesti sõltumatud mõisted; otsast lõpuni süsteemi ei pruugi juhtida suured mudelid ega ka tingimata puhas nägemus. of.
3.Kas pikemas perspektiivis on ülalmainitud otsast lõpuni süsteemiga kitsas tähenduses võimalik saavutada autonoomne sõit üle L3 taseme?
Selle, mida praegu nimetatakse puhtaks otsast lõpuni FSD-ks, jõudlus ei ole kaugeltki piisav, et täita L3 tasemel nõutavat töökindlust ja stabiilsust. Ausamalt öeldes, kui isejuhtiv süsteem soovib, et avalikkus seda aktsepteeriks, on võti selles, kas avalikkus suudab nõustuda sellega, et mõnel juhul teeb masin vigu ja inimesed saavad need hõlpsalt lahendada. See on puhta otspunkti süsteemi puhul keerulisem.
Näiteks nii Waymo kui ka Cruise'iga Põhja-Ameerikas on juhtunud palju õnnetusi. Cruise'i viimane õnnetus lõppes aga kahe vigastusega, kuigi sellised õnnetused on inimjuhtide jaoks üsna vältimatud ja vastuvõetavad. Kuid pärast seda õnnetust hindas süsteem õnnetuse ja vigastatute asukohta valesti ning alandas ületõmberežiimi, põhjustades vigastatute pikaajalist lohistamist. Selline käitumine on vastuvõetamatu ühelegi normaalsele inimjuhile. Seda ei tehta ja tulemused on väga halvad.
Lisaks on see äratus, et peaksime hoolikalt kaaluma, kuidas sellist olukorda autonoomsete sõidusüsteemide väljatöötamise ja kasutamise ajal vältida.
4. Millised on praegusel hetkel praktilised lahendused järgmise põlvkonna masstoodetud juhtimisabisüsteemide jaoks?
Minu praeguse arusaama järgi annab sõidus nn otsast lõpuni mudelit kasutades pärast trajektoori väljastamist tagasi traditsioonilistel meetoditel põhineva lahenduse. Teise võimalusena väljastavad õppimispõhised planeerijad ja traditsioonilised trajektooride planeerimise algoritmid korraga mitu trajektoori ja valivad seejärel valija kaudu ühe trajektoori.
Selline varjatud lahendus ja valik piirab selle süsteemiarhitektuuri kasutuselevõtul selle kaskaadsüsteemi jõudluse ülempiiri. Kui see meetod põhineb endiselt puhtal tagasiside õppimisel, siis tekivad ettearvamatud tõrked ja eesmärk olla ohutu jääb üldse saavutamata.
Kui mõelda sellele väljundtrajektoorile traditsiooniliste planeerimismeetodite uuesti optimeerimisele või valimisele, on see samaväärne õppimispõhise meetodi abil loodud trajektooriga; miks me siis seda trajektoori otseselt ei optimeeri ega otsi?
Muidugi ütlevad mõned inimesed, et selline optimeerimis- või otsinguprobleem on mittekumer, sellel on suur olekuruum ja seda on võimatu sõidukisiseses süsteemis reaalajas käivitada. Ma palun kõigil seda küsimust hoolikalt kaaluda: viimase kümne aasta jooksul on tajusüsteem saanud vähemalt sada korda suurema arvutusvõimsuse dividendi, aga kuidas on lood meie PnC-mooduliga?
Kui lubame PnC-moodulil kasutada ka suurt arvutusvõimsust koos viimaste aastate täiustatud optimeerimisalgoritmide edusammudega, kas see järeldus on ikka õige? Seda tüüpi probleemi puhul peaksime esmalt kaaluma, mis on õige.
5.Kuidas ühitada suhet andmepõhiste ja traditsiooniliste meetodite vahel?
Male mängimine on autonoomse sõiduga väga sarnane näide. Selle aasta veebruaris avaldas Deepmind artikli nimega "Grandmaster-Level Chess Without Search", milles arutati, kas AlphaGo ja AlphaZero puhul on võimalik kasutada ainult andmepõhist otsingut ja loobuda MCTS-otsingust. Sarnaselt autonoomsele sõidule kasutatakse toimingute otseseks väljastamiseks ainult ühte võrku, samas kui kõiki järgnevaid samme ignoreeritakse.
Artiklis jõutakse järeldusele, et vaatamata märkimisväärsele andmehulgale ja mudeliparameetritele on üsna mõistlikud tulemused võimalik saada ilma otsingut kasutamata. Siiski on otsingut kasutavate meetoditega võrreldes olulisi erinevusi. See on eriti kasulik keeruliste lõppmängude lahendamisel.
Keeruliste stsenaariumide või nurgapealsete juhtumite puhul, mis nõuavad mitmeastmelisi mänge, muudab see analoogia siiski keeruliseks traditsioonilistest optimeerimis- või otsingualgoritmidest täielikult loobumise. Erinevate tehnoloogiate, nagu AlphaZero, eeliste mõistlik ärakasutamine on parim viis jõudluse parandamiseks.
6. Traditsiooniline meetod = reeglipõhine kui muidu?
Olen pidanud seda mõistet paljude inimestega vesteldes ikka ja jälle parandama. Paljud inimesed usuvad, et seni, kuni see ei ole puhtalt andmepõhine, ei ole see ka reeglitel põhinev. Näiteks males on valemite ja malerekordite meeldejätmine reeglite järgi reeglipõhine, kuid nagu AlphaGo ja AlphaZero, annab see mudelile võimaluse olla optimeerimise ja otsingu kaudu ratsionaalne. Ma arvan, et seda ei saa nimetada reeglipõhiseks.
Seetõttu puudub praegu suur mudel ise ja teadlased püüavad pakkuda õppimispõhist mudelit selliste meetodite nagu CoT abil. Erinevalt ülesannetest, mis nõuavad puhtalt andmepõhist pildituvastust ja seletamatuid põhjuseid, on igal roolis oleva inimese tegevusel selge edasiviiv jõud.
Sobiva algoritmiarhitektuuri kujunduse korral peaks otsustustrajektoor muutuma muutuvaks ja olema ühtselt optimeeritud teaduslike eesmärkide juhtimisel, selle asemel, et parameetreid sunniviisiliselt parandada ja kohandada erinevate juhtumite parandamiseks. Sellises süsteemis ei ole loomulikult igasuguseid sisse kodeeritud kummalisi reegleid.
Järeldus
Lühidalt öeldes võib ots otsast lõpuni olla paljutõotav tehniline tee, kuid kontseptsiooni rakendamine nõuab rohkem uurimist. Ma arvan, et hunnik andmeid ja mudeliparameetreid ei ole ainuõige lahendus ja kui tahame teisi edestada, peame kõvasti tööd tegema.
Postitusaeg: 24. aprill 2024