Jak definovat ucelený systém autonomního řízení?
Nejběžnější definicí je, že „end-to-end“ systém je systém, který vkládá nezpracované informace ze senzoru a přímo vydává proměnné, které se týkají daného úkolu. Například při rozpoznávání obrazu lze CNN nazvat „end-to-end“ ve srovnání s tradiční metodou funkce + klasifikátor.
V úlohách autonomního řízení jsou na vstupu data z různých senzorů (jako jsou kamery, LiDAR, Radar nebo IMU...) a signály ovládání vozidla (jako je plyn nebo úhel volantu) jsou přímo výstupem. Aby bylo možné vzít v úvahu problémy s přizpůsobením různých modelů vozidel, lze výstup také upravit podle jízdní trajektorie vozidla.
Na základě tohoto základu se také objevily modulární koncepce typu end-to-end, jako je UniAD, které zlepšují výkon zavedením dohledu nad příslušnými meziúkoly, navíc ke konečným výstupním řídicím signálům nebo trasovým bodům. Z takto úzké definice by však podstatou end-to-end měl být bezztrátový přenos smyslových informací.
Podívejme se nejprve na rozhraní mezi snímacími a PnC moduly v non-end-to-end systémech. Obvykle detekujeme objekty na seznamu povolených (jako jsou auta, lidé atd.) a analyzujeme a předpovídáme jejich vlastnosti. Učíme se také o statickém prostředí (jako je struktura vozovky, rychlostní limity, semafory atd.). Kdybychom byli podrobnější, odhalili bychom i univerzální překážky. Stručně řečeno, výstup informací z těchto vjemů představuje model zobrazení složitých jízdních scén.
U některých velmi zřejmých scén však současná explicitní abstrakce nedokáže plně popsat faktory, které ovlivňují jízdní chování ve scéně, nebo úkoly, které potřebujeme definovat, jsou příliš triviální a je obtížné vyjmenovat všechny požadované úkoly. Proto end-to-end systémy poskytují (možná implicitně) komplexní reprezentaci s nadějí na automatické a bezztrátové působení na PnC s touto informací. Podle mého názoru lze všechny systémy, které dokážou splnit tento požadavek, nazvat zobecněné end-to-end.
Pokud jde o další problémy, jako jsou některé optimalizace scénářů dynamických interakcí, domnívám se, že přinejmenším nejen end-to-end může tyto problémy vyřešit a end-to-end nemusí být tím nejlepším řešením. Tradiční metody mohou tyto problémy vyřešit a samozřejmě, když je množství dat dostatečně velké, může end-to-end poskytnout lepší řešení.
Některá nedorozumění ohledně autonomního řízení typu end-to-end
1. Řídicí signály a navigační body musí být na výstupu, aby byly end-to-end.
Pokud souhlasíte s výše uvedeným širokým konceptem end-to-end, pak je tento problém snadno pochopitelný. End-to-end by měl klást důraz na bezztrátový přenos informací spíše než na přímý výstup objemu úlohy. Úzký end-to-end přístup způsobí spoustu zbytečných problémů a bude vyžadovat mnoho skrytých řešení pro zajištění bezpečnosti.
2. Systém end-to-end musí být založen na velkých modelech nebo čisté vizi.
Mezi komplexním autonomním řízením, autonomním řízením velkých modelů a čistě vizuálním autonomním řízením neexistuje žádné nezbytné spojení, protože jde o zcela nezávislé koncepty; end-to-end systém nemusí být nutně poháněn velkými modely, ani není nutně poháněn čistou vizí. z.
3.Je dlouhodobě možné, aby výše zmíněný end-to-end systém v užším smyslu dosáhl autonomního řízení nad úrovní L3?
Výkon toho, co se v současnosti nazývá čistým end-to-end FSD, zdaleka nestačí ke splnění spolehlivosti a stability požadované na úrovni L3. Jednodušeji řečeno, pokud chce být samořídící systém akceptován veřejností, klíčové je, zda veřejnost dokáže akceptovat, že v některých případech bude stroj dělat chyby a lidé je snadno vyřeší. To je pro čistý end-to-end systém obtížnější.
Například Waymo i Cruise v Severní Americe měli mnoho nehod. Cruisova poslední nehoda však měla za následek dvě zranění, i když takové nehody jsou pro lidské řidiče zcela nevyhnutelné a přijatelné. Po této nehodě však systém špatně odhadl místo nehody a místo zraněných a přešel do režimu pull-over, což způsobilo, že zranění byli dlouho vláčeni. Toto chování je pro normálního lidského řidiče nepřijatelné. To se neudělá a výsledky budou velmi špatné.
Dále je to budíček, že bychom měli při vývoji a provozu systémů autonomního řízení pečlivě zvážit, jak se této situaci vyhnout.
4. Jaká jsou tedy v tuto chvíli praktická řešení pro příští generaci sériově vyráběných systémů asistovaného řízení?
Podle mého současného chápání při použití tzv. end-to-end modelu v jízdě po vypsání trajektorie vrátí řešení založené na tradičních metodách. Alternativně plánovače založené na učení a tradiční algoritmy plánování trajektorie vydávají současně více trajektorií a poté pomocí selektoru jednu trajektorii vyberou.
Tento druh skrytého řešení a volby omezuje horní hranici výkonu tohoto kaskádového systému, pokud je tato architektura systému přijata. Pokud je tato metoda stále založena na čistě zpětnovazebním učení, dojde k nepředvídatelným selháním a cíle být v bezpečí nebude vůbec dosaženo.
Pokud zvážíme reoptimalizaci nebo výběr pomocí tradičních plánovacích metod na této výstupní trajektorii, je to ekvivalentní trajektorii vytvořené metodou řízenou učením; proč tedy přímo neoptimalizujeme a neprohledáváme tuto trajektorii?
Někteří lidé by samozřejmě řekli, že takový problém s optimalizací nebo vyhledáváním je nekonvexní, má velký stavový prostor a nelze jej spustit v reálném čase na systému ve vozidle. Vyzývám všechny, aby pečlivě zvážili tuto otázku: Za posledních deset let získal systém vnímání nejméně stonásobek dividendy výpočetního výkonu, ale co náš modul PnC?
Pokud také dovolíme modulu PnC využívat velký výpočetní výkon v kombinaci s určitými pokroky v pokročilých optimalizačních algoritmech v posledních letech, je tento závěr stále správný? U tohoto druhu problému bychom měli zvážit, co je správné z prvních principů.
5.Jak sladit vztah mezi daty řízenými a tradičními metodami?
Hraní šachů je příkladem velmi podobným autonomnímu řízení. V únoru tohoto roku Deepmind publikoval článek nazvaný „Grandmaster-Level Chess Without Search“, v němž pojednává o tom, zda je možné v AlphaGo a AlphaZero používat pouze vyhledávání řízené daty a opustit vyhledávání MCTS. Podobně jako u autonomního řízení se k přímému výstupu akcí používá pouze jedna síť, zatímco všechny následující kroky jsou ignorovány.
Článek dochází k závěru, že navzdory značnému množství dat a parametrů modelu lze získat poměrně rozumné výsledky bez použití vyhledávání. Oproti metodám využívajícím vyhledávání však existují značné rozdíly. To je zvláště užitečné pro řešení některých složitých koncových her.
U složitých scénářů nebo rohových případů, které vyžadují vícekrokové hry, tato analogie stále ztěžuje úplné opuštění tradičních optimalizačních nebo vyhledávacích algoritmů. Rozumné využití výhod různých technologií, jako je AlphaZero, je nejlepší způsob, jak zlepšit výkon.
6. Tradiční metoda = založená na pravidlech, pokud jinak?
Musel jsem tento koncept znovu a znovu opravovat, když jsem mluvil s mnoha lidmi. Mnoho lidí věří, že pokud není založeno čistě na datech, není založeno na pravidlech. Například v šachu je zapamatování vzorců a šachových záznamů nazpaměť založené na pravidlech, ale stejně jako AlphaGo a AlphaZero dává modelu schopnost být racionální prostřednictvím optimalizace a vyhledávání. Nemyslím si, že to lze nazvat založené na pravidlech.
Z tohoto důvodu v současné době chybí samotný velký model a výzkumníci se snaží poskytnout model založený na učení pomocí metod, jako je CoT. Na rozdíl od úkolů, které vyžadují čistě datové rozpoznávání obrazu a nevysvětlitelné důvody, má však každá akce řidiče jasnou hnací sílu.
Podle návrhu architektury vhodného algoritmu by se trajektorie rozhodování měla stát proměnlivou a jednotně optimalizována pod vedením vědeckých cílů, spíše než násilným záplatováním a nastavováním parametrů k opravě různých případů. Takový systém přirozeně nemá všelijaká napevno zakódovaná podivná pravidla.
Závěr
Stručně řečeno, end-to-end může být slibnou technickou cestou, ale to, jak je koncept aplikován, vyžaduje další výzkum. Myslím si, že hromada dat a parametrů modelu není jediné správné řešení, a pokud chceme překonat ostatní, musíme dál tvrdě pracovat.
Čas odeslání: 24. dubna 2024