End-to-End systémy autonómneho riadenia: Driving the Future

End-to-end autonómne riadenie

Ako definovať komplexný systém autonómneho riadenia?

Najbežnejšou definíciou je, že „end-to-end“ systém je systém, ktorý vkladá nespracované informácie zo senzora a priamo vydáva premenné, ktoré sa týkajú úlohy. Napríklad pri rozpoznávaní obrazu možno CNN nazvať „end-to-end“ v porovnaní s tradičnou metódou funkcie + klasifikátora.

 

Pri úlohách autonómneho riadenia sú vstupom údaje z rôznych senzorov (ako sú kamery, LiDAR, Radar alebo IMU...) a priamo výstupné signály riadenia vozidla (napríklad plyn alebo uhol volantu). Aby sa zvážili problémy s prispôsobením rôznych modelov vozidiel, výstup môže byť tiež prispôsobený jazdnej trajektórii vozidla.

 

Na tomto základe vznikli aj modulárne koncepcie typu end-to-end, ako napríklad UniAD, ktoré zlepšujú výkon zavedením dohľadu nad príslušnými medziľahlými úlohami okrem konečných výstupných riadiacich signálov alebo trasových bodov. Z takejto úzkej definície by však podstatou end-to-end mal byť bezstratový prenos zmyslových informácií.

 

Najprv sa pozrime na rozhrania medzi snímacími a PnC modulmi v systémoch typu non-end-to-end. Zvyčajne zisťujeme objekty na bielej listine (ako sú autá, ľudia atď.) a analyzujeme a predpovedáme ich vlastnosti. Dozvedáme sa aj o statickom prostredí (ako je štruktúra vozovky, rýchlostné limity, semafory a pod.). Ak by sme boli detailnejší, odhalili by sme aj univerzálne prekážky. Stručne povedané, výstup informácií z týchto vnemov predstavuje model zobrazenia zložitých jazdných scén.

 

Pri niektorých veľmi zjavných scénach však súčasná explicitná abstrakcia nedokáže úplne opísať faktory, ktoré ovplyvňujú jazdné správanie v scéne, alebo úlohy, ktoré musíme definovať, sú príliš triviálne a je ťažké vymenovať všetky požadované úlohy. Preto end-to-end systémy poskytujú (možno implicitne) komplexnú reprezentáciu s nádejou na automatické a bezstratové pôsobenie na PnC s týmito informáciami. Podľa môjho názoru všetky systémy, ktoré dokážu splniť túto požiadavku, možno nazvať zovšeobecnené end-to-end.

 

Čo sa týka iných problémov, ako sú niektoré optimalizácie scenárov dynamickej interakcie, verím, že tieto problémy môže vyriešiť aspoň end-to-end a end-to-end nemusí byť tým najlepším riešením. Tradičné metódy môžu vyriešiť tieto problémy a samozrejme, keď je množstvo údajov dostatočne veľké, end-to-end môže poskytnúť lepšie riešenie.

Niektoré nedorozumenia o autonómnom riadení typu end-to-end

1. Riadiace signály a trasové body musia byť na výstupe, aby boli od konca po koniec.

Ak súhlasíte so širokým komplexným konceptom diskutovaným vyššie, potom je tento problém ľahko pochopiteľný. End-to-end by mal klásť dôraz na bezstratový prenos informácií a nie na priamy výstup objemu úlohy. Úzky prístup typu end-to-end spôsobí veľa zbytočných problémov a bude vyžadovať veľa skrytých riešení na zaistenie bezpečnosti.

2. Komplexný systém musí byť založený na veľkých modeloch alebo čistej vízii.

Neexistuje žiadne nevyhnutné prepojenie medzi autonómnym riadením, autonómnym riadením veľkých modelov a čisto vizuálnym autonómnym riadením, pretože ide o úplne nezávislé koncepty; end-to-end systém nie je nevyhnutne poháňaný veľkými modelmi, ani nie je nevyhnutne poháňaný čistou víziou. z

End-to-end systém výskumu a vývoja autonómneho riadenia

3.Je z dlhodobého hľadiska možné, aby vyššie uvedený end-to-end systém v užšom zmysle dosiahol autonómnu jazdu nad úrovňou L3?

 

Výkon toho, čo sa v súčasnosti nazýva čistý end-to-end FSD, zďaleka nestačí na splnenie spoľahlivosti a stability požadovanej na úrovni L3. Povedané otvorenejšie, ak chce byť samoriadiaci systém akceptovaný verejnosťou, kľúčové je, či verejnosť dokáže akceptovať, že v niektorých prípadoch bude stroj robiť chyby a ľudia ich ľahko vyriešia. To je ťažšie pre čistý end-to-end systém.

 

Napríklad Waymo aj Cruise v Severnej Amerike mali veľa nehôd. Cruisova posledná nehoda však mala za následok dve zranenia, hoci takéto nehody sú pre ľudských vodičov celkom nevyhnutné a prijateľné. Po tejto nehode však systém nesprávne odhadol miesto nehody a miesto zranených a prešiel do režimu pull-over, čo spôsobilo, že zranení boli dlho ťahaní. Toto správanie je pre bežného ľudského vodiča neprijateľné. Nestane sa to a výsledky budú veľmi zlé.

 

Ďalej je to budíček, že by sme mali pri vývoji a prevádzke systémov autonómneho riadenia dôkladne zvážiť, ako sa tejto situácii vyhnúť.

4. Aké sú teda v súčasnosti praktické riešenia pre ďalšiu generáciu sériovo vyrábaných systémov asistovaného riadenia?

 

Podľa môjho súčasného chápania, pri použití takzvaného end-to-end modelu v jazde, po výstupe trajektórie vráti riešenie založené na tradičných metódach. Alternatívne môžu plánovače založené na učení a tradičné algoritmy plánovania trajektórií vygenerovať viacero trajektórií súčasne a potom vybrať jednu trajektóriu pomocou selektora.

 

Tento druh skrytého riešenia a výberu obmedzuje hornú hranicu výkonu tohto kaskádového systému, ak je prijatá táto systémová architektúra. Ak je táto metóda stále založená na čistom spätnom učení, dôjde k nepredvídateľným zlyhaniam a cieľ byť v bezpečí sa vôbec nedosiahne.

 

Ak uvažujeme o opätovnej optimalizácii alebo výbere pomocou tradičných metód plánovania na tejto výstupnej trajektórii, je to ekvivalentné trajektórii vytvorenej metódou založenou na učení; Prečo teda túto trajektóriu priamo neoptimalizujeme a nevyhľadáme?

 

Samozrejme, niektorí ľudia by povedali, že takýto problém s optimalizáciou alebo vyhľadávaním je nekonvexný, má veľký stavový priestor a nie je možné ho spustiť v reálnom čase na systéme vo vozidle. Prosím všetkých, aby dôkladne zvážili túto otázku: Za posledných desať rokov systém vnímania získal najmenej stonásobok dividendy výpočtového výkonu, ale čo náš modul PnC?

 

Ak tiež umožníme modulu PnC využívať veľký výpočtový výkon v kombinácii s určitými pokrokmi v pokročilých optimalizačných algoritmoch v posledných rokoch, je tento záver stále správny? Pri tomto druhu problému by sme mali zvážiť, čo je správne od prvých zásad.

5.Ako zosúladiť vzťah medzi metódami založenými na údajoch a tradičnými metódami?

 

Hranie šachu je príklad veľmi podobný autonómnemu riadeniu. Vo februári tohto roku Deepmind publikoval článok s názvom „Šach na úrovni veľmajstra bez vyhľadávania“, v ktorom sa diskutuje o tom, či je možné v AlphaGo a AlphaZero použiť iba vyhľadávanie založené na údajoch a opustiť vyhľadávanie MCTS. Podobne ako pri autonómnom riadení sa na priamy výstup akcií používa iba jedna sieť, pričom všetky nasledujúce kroky sa ignorujú.

 

V článku sa uvádza, že napriek značnému množstvu údajov a parametrov modelu je možné získať pomerne rozumné výsledky bez použitia vyhľadávania. V porovnaní s metódami využívajúcimi vyhľadávanie sú však značné rozdiely. Toto je obzvlášť užitočné pri riešení niektorých zložitých koncových hier.

 

Pre komplexné scenáre alebo rohové prípady, ktoré si vyžadujú hry s viacerými krokmi, táto analógia stále sťažuje úplné opustenie tradičných optimalizačných alebo vyhľadávacích algoritmov. Rozumné využitie výhod rôznych technológií, ako je AlphaZero, je najlepší spôsob, ako zlepšiť výkon.

Ovládanie vozidla

6. Tradičná metóda = založená na pravidlách, ak inak?

 

Počas rozhovoru s mnohými ľuďmi som tento koncept musel znova a znova opravovať. Mnoho ľudí verí, že pokiaľ to nie je založené výlučne na údajoch, nie je to založené na pravidlách. Napríklad v šachu je memorovanie vzorcov a šachových záznamov naspamäť založené na pravidlách, ale podobne ako AlphaGo a AlphaZero dáva modelu schopnosť byť racionálny prostredníctvom optimalizácie a vyhľadávania. Nemyslím si, že by sa to dalo nazvať pravidlom.

 

Z tohto dôvodu v súčasnosti chýba samotný veľký model a výskumníci sa snažia poskytnúť model založený na učení prostredníctvom metód, ako je CoT. Avšak na rozdiel od úloh, ktoré vyžadujú čisté rozpoznávanie obrazu založené na údajoch a nevysvetliteľné dôvody, má každý čin vodiča jasnú hnaciu silu.

 

Podľa návrhu architektúry vhodného algoritmu by sa rozhodovacia trajektória mala stať variabilnou a jednotne optimalizovaná pod vedením vedeckých cieľov, a nie násilným opravovaním a nastavovaním parametrov na opravu rôznych prípadov. Takýto systém prirodzene nemá všetky druhy pevne zakódovaných podivných pravidiel.

Záver

Stručne povedané, end-to-end môže byť sľubnou technickou cestou, ale ako sa tento koncept aplikuje, si vyžaduje ďalší výskum. Myslím si, že kopa údajov a parametrov modelu nie je jediným správnym riešením a ak chceme prekonať ostatných, musíme tvrdo pracovať.


Čas odoslania: 24. apríla 2024