Kako definirati sistem avtonomne vožnje od konca do konca?
Najpogostejša definicija je, da je sistem "end-to-end" sistem, ki vnaša neobdelane informacije senzorja in neposredno izpisuje spremenljivke, ki zadevajo nalogo. Na primer, pri prepoznavanju slik lahko CNN imenujemo "od konca do konca" v primerjavi s tradicionalno metodo funkcija + klasifikator.
Pri nalogah avtonomne vožnje se vnašajo podatki iz različnih senzorjev (kot so kamere, LiDAR, Radar ali IMU ...), krmilni signali vozila (kot je plin ali kot volana) pa se posredujejo neposredno. Da bi upoštevali težave s prilagajanjem različnih modelov vozil, je mogoče izhod tudi sprostiti glede na pot vožnje vozila.
Na tej podlagi so se pojavili tudi modularni koncepti od konca do konca, kot je UniAD, ki izboljšujejo zmogljivost z uvedbo nadzora relevantnih vmesnih nalog, poleg končnih izhodnih kontrolnih signalov ali točk poti. Vendar bi moralo biti iz tako ozke definicije bistvo od konca do konca prenos senzoričnih informacij brez izgub.
Najprej si oglejmo vmesnike med zaznavanjem in moduli PnC v sistemih, ki niso od konca do konca. Običajno zaznavamo predmete na beli listi (kot so avtomobili, ljudje itd.) ter analiziramo in predvidevamo njihove lastnosti. Spoznavamo tudi statično okolje (kot so cestna struktura, omejitve hitrosti, semaforji itd.). Če bi bili bolj podrobni, bi zaznali tudi univerzalne ovire. Skratka, informacije, ki jih oddajajo te zaznave, predstavljajo prikazni model zapletenih prizorov vožnje.
Vendar pa za nekatere zelo očitne prizore trenutna eksplicitna abstrakcija ne more v celoti opisati dejavnikov, ki vplivajo na vedenje pri vožnji v prizoru, ali pa so naloge, ki jih moramo definirati, preveč trivialne in je težko našteti vse zahtevane naloge. Zato sistemi od konca do konca zagotavljajo (morda implicitno) celovito predstavitev z upanjem, da bodo samodejno in brez izgub delovali na PnC s temi informacijami. Po mojem mnenju lahko vse sisteme, ki lahko izpolnijo to zahtevo, imenujemo generalizirani end-to-end.
Kar zadeva druga vprašanja, kot so nekatere optimizacije scenarijev dinamične interakcije, verjamem, da teh težav ne more rešiti samo end-to-end in end-to-end morda ni najboljša rešitev. Tradicionalne metode lahko rešijo te težave in seveda, ko je količina podatkov dovolj velika, lahko end-to-end zagotovi boljšo rešitev.
Nekaj nesporazumov o avtonomni vožnji od konca do konca
1. Kontrolni signali in točke poti morajo biti oddani od konca do konca.
Če se strinjate s širokim konceptom od konca do konca, o katerem smo govorili zgoraj, potem je to težavo enostavno razumeti. Od konca do konca bi moral poudarjati prenos informacij brez izgub namesto neposrednega izpisa količine naloge. Ozek pristop od konca do konca bo povzročil veliko nepotrebnih težav in zahteval veliko prikritih rešitev za zagotovitev varnosti.
2. Sistem od konca do konca mora temeljiti na velikih modelih ali čisti viziji.
Ni nujne povezave med avtonomno vožnjo od konca do konca, avtonomno vožnjo velikih modelov in čisto vizualno avtonomno vožnjo, ker so popolnoma neodvisni koncepti; sistema od konca do konca ne poganjajo nujno veliki modeli, niti ga ne poganja nujno čista vizija. od.
3. Ali je dolgoročno mogoče z zgoraj omenjenim sistemom od konca do konca v ožjem smislu doseči avtonomno vožnjo nad nivojem L3?
Zmogljivost tega, kar se trenutno imenuje čisti FSD od konca do konca, še zdaleč ni zadostna za izpolnjevanje zahtevane zanesljivosti in stabilnosti na ravni L3. Če povemo odkrito, če želi, da bi javnost sprejela samovozeči sistem, je ključno, ali lahko javnost sprejme, da bo v nekaterih primerih stroj delal napake, ljudje pa jih lahko zlahka rešijo. To je težje pri čistem sistemu od konca do konca.
Tako Waymo kot Cruise v Severni Ameriki sta imela na primer veliko nesreč. Vendar pa sta Cruisova zadnja nesreča povzročila dve poškodbi, čeprav so takšne nesreče dokaj neizogibne in sprejemljive za človeške voznike. Vendar je po tej nesreči sistem napačno ocenil lokacijo nesreče in lokacijo poškodovanih ter prešel na način umika, zaradi česar so poškodovane dolgo vlekli. To vedenje je nesprejemljivo za vsakega normalnega človeškega voznika. Ne bo storjeno in rezultati bodo zelo slabi.
Poleg tega je to opozorilo, da moramo med razvojem in delovanjem sistemov avtonomne vožnje skrbno razmisliti, kako se izogniti tej situaciji.
4. Katere so torej v tem trenutku praktične rešitve za naslednjo generacijo množično proizvedenih sistemov za pomoč pri vožnji?
Glede na moje trenutno razumevanje bo pri uporabi tako imenovanega modela od konca do konca pri vožnji po izhodu trajektorije vrnil rešitev, ki temelji na tradicionalnih metodah. Druga možnost je, da načrtovalci, ki temeljijo na učenju, in tradicionalni algoritmi za načrtovanje trajektorij hkrati izdajo več trajektorij in nato prek izbirnika izberejo eno trajektorijo.
Ta vrsta skrite rešitve in izbire omejuje zgornjo mejo zmogljivosti tega kaskadnega sistema, če je sprejeta ta sistemska arhitektura. Če ta metoda še vedno temelji na čistem učenju s povratnimi informacijami, se bodo pojavile nepredvidljive napake in cilj biti varen sploh ne bo dosežen.
Če upoštevamo ponovno optimizacijo ali izbiro z uporabo tradicionalnih metod načrtovanja na tej izhodni poti, je to enakovredno poti, ki jo ustvari metoda, ki temelji na učenju; zakaj torej te poti neposredno ne optimiziramo in iščemo?
Seveda bi nekateri ljudje rekli, da tak problem optimizacije ali iskanja ni konveksen, ima velik prostor stanj in ga je nemogoče izvajati v realnem času na sistemu v vozilu. Prosim vse, da natančno razmislijo o tem vprašanju: V zadnjih desetih letih je sistem zaznavanja prejel vsaj stokrat večjo računalniško moč, kaj pa naš modul PnC?
Če modulu PnC dovolimo tudi uporabo velike računalniške moči v kombinaciji z nekaterimi napredki naprednih optimizacijskih algoritmov v zadnjih letih, ali je ta sklep še vedno pravilen? Za to vrsto problema bi morali razmisliti, kaj je pravilno iz prvih načel.
5.Kako uskladiti razmerje med podatkovno vodenimi in tradicionalnimi metodami?
Igranje šaha je primer, ki je zelo podoben avtonomni vožnji. Februarja letos je Deepmind objavil članek z naslovom "Grandmaster-Level Chess Without Search", v katerem razpravlja o tem, ali je izvedljivo uporabljati le podatkovno usmerjeno iskanje in opustiti iskanje MCTS v AlphaGo in AlphaZero. Podobno kot pri avtonomni vožnji se za neposredno izpisovanje dejanj uporablja le eno omrežje, medtem ko so vsi naslednji koraki prezrti.
Članek ugotavlja, da je kljub precejšnji količini podatkov in parametrov modela mogoče dobiti dokaj razumne rezultate brez uporabe iskanja. Vendar pa obstajajo pomembne razlike v primerjavi z metodami, ki uporabljajo iskanje. To je še posebej uporabno za obravnavo nekaterih zapletenih končnih iger.
Za zapletene scenarije ali kotne primere, ki zahtevajo večstopenjske igre, ta analogija še vedno otežuje popolno opustitev tradicionalnih optimizacijskih ali iskalnih algoritmov. Razumna uporaba prednosti različnih tehnologij, kot je AlphaZero, je najboljši način za izboljšanje učinkovitosti.
6.Tradicionalna metoda = temelji na pravilih, če drugače?
Med pogovorom z mnogimi ljudmi sem moral vedno znova popravljati ta koncept. Mnogi ljudje verjamejo, da dokler ne temelji zgolj na podatkih, ne temelji na pravilih. Na primer, v šahu pomnjenje formul in šahovskih zapisov na pamet temelji na pravilih, vendar tako kot AlphaGo in AlphaZero daje modelu možnost, da je racionalen z optimizacijo in iskanjem. Mislim, da temu ne moremo reči, da temelji na pravilih.
Zaradi tega velik model trenutno manjka, raziskovalci pa poskušajo zagotoviti model, ki temelji na učenju, z metodami, kot je CoT. Vendar pa ima za razliko od nalog, ki zahtevajo čisto prepoznavanje slik na podlagi podatkov in nerazložljive razloge, vsako dejanje osebe, ki vozi, jasno gonilno silo.
V skladu z ustrezno zasnovo arhitekture algoritma bi morala pot odločanja postati spremenljiva in enotno optimizirana pod vodstvom znanstvenih ciljev, namesto da bi morali na silo krpati in prilagajati parametre za popravljanje različnih primerov. Takšen sistem seveda nima vseh vrst trdo kodiranih čudnih pravil.
Zaključek
Skratka, od konca do konca je lahko obetavna tehnična pot, vendar je za uporabo tega koncepta potrebno več raziskav. Mislim, da kopica podatkov in modelskih parametrov ni edina pravilna rešitev in če hočemo preseči druge, moramo še naprej trdo delati.
Čas objave: 24. aprila 2024