Hogyan határozzunk meg egy végponttól végpontig autonóm vezetési rendszert?
A legáltalánosabb definíció szerint a „végponttól végpontig terjedő” rendszer olyan rendszer, amely nyers szenzorinformációkat visz be, és közvetlenül adja ki a feladathoz kapcsolódó változókat. Például a képfelismerésben a CNN-t "end-to-end"-nek nevezhetjük a hagyományos jellemző + osztályozó módszerhez képest.
Az autonóm vezetési feladatok során a különböző érzékelőktől (például kameráktól, LiDAR-tól, radartól vagy IMU-tól) származó adatok bemenetre kerülnek, és a járművezérlő jelek (például a gázkar vagy a kormánykerék szöge) közvetlenül kerülnek kiadásra. A különböző járműmodellek alkalmazkodási problémáinak figyelembevételéhez a kimenetet a jármű vezetési pályájához is lehet lazítani.
Erre az alapra alapozva olyan moduláris, end-to-end koncepciók is megjelentek, mint például az UniAD, amelyek a végső kimeneti vezérlőjelek vagy útpontok mellett a releváns köztes feladatok felügyeletének bevezetésével javítják a teljesítményt. Márpedig egy ilyen szűk definícióból a végpontok közötti lényege az érzékszervi információ veszteségmentes továbbítása.
Először tekintsük át az érzékelő és a PnC modulok közötti interfészt nem végponttól végpontig terjedő rendszerekben. Általában észleljük az engedélyezőlistán szereplő objektumokat (például autókat, embereket stb.), és elemezzük és megjósoljuk tulajdonságaikat. Megismerjük a statikus környezetet is (például útszerkezet, sebességkorlátozás, jelzőlámpa stb.). Ha részletesebbek lennénk, univerzális akadályokat is észlelnénk. Röviden, az ezen észlelések által kibocsátott információ összetett vezetési jelenetek megjelenítési modelljét alkotja.
Néhány nagyon nyilvánvaló jelenet esetében azonban a jelenlegi explicit absztrakció nem tudja teljes mértékben leírni a jelenetben a vezetési magatartást befolyásoló tényezőket, vagy a meghatározandó feladatok túlságosan triviálisak, és nehéz felsorolni az összes szükséges feladatot. Ezért a végponttól végpontig terjedő rendszerek (talán implicit módon) átfogó reprezentációt nyújtanak, abban a reményben, hogy automatikusan és veszteségmentesen hatnak a PnC-kre ezen információk birtokában. Véleményem szerint minden rendszer, amely megfelel ennek a követelménynek, általánosított végponttól végpontig nevezhető.
Ami más kérdéseket illeti, mint például a dinamikus interakciós forgatókönyvek optimalizálása, úgy gondolom, hogy legalább nem csak a végpontok között lehet megoldani ezeket a problémákat, és nem biztos, hogy a végpontok közötti megoldás a legjobb megoldás. A hagyományos módszerekkel meg lehet oldani ezeket a problémákat, és persze, ha elég nagy az adatmennyiség, a végpontok közötti kapcsolat jobb megoldást jelenthet.
Néhány félreértés a végpontok közötti autonóm vezetéssel kapcsolatban
1. A vezérlőjeleket és az útpontokat végponttól végpontig kell kiadni.
Ha egyetért a fent tárgyalt tág, végpontok közötti koncepcióval, akkor ez a probléma könnyen megérthető. A végpontok között az információ veszteségmentes továbbítását kell hangsúlyoznia, nem pedig a feladatkötet közvetlen kiadását. A szűk, teljes körű megközelítés sok felesleges problémát okoz, és sok rejtett megoldást igényel a biztonság érdekében.
2. A végpontok közötti rendszernek nagy modelleken vagy tiszta látásmódon kell alapulnia.
Nincs szükségszerű kapcsolat a végponttól végpontig autonóm vezetés, a nagymodell-autonóm vezetés és a tisztán vizuális autonóm vezetés között, mivel ezek teljesen független fogalmak; egy végponttól végpontig terjedő rendszert nem feltétlenül a nagy modellek vezérlik, és nem is feltétlenül a tiszta látás. -ból.
3.Hosszú távon lehetséges-e a fent említett szűk értelemben vett end-to-end rendszerrel az L3 szint feletti autonóm vezetés?
A jelenleg tiszta végponttól végpontig terjedő FSD teljesítménye messze nem elegendő ahhoz, hogy megfeleljen az L3 szinten megkövetelt megbízhatóságnak és stabilitásnak. Pontosabban fogalmazva, ha az önvezető rendszert el akarja fogadni a közvélemény, a kulcs az, hogy a közvélemény el tudja-e fogadni, hogy bizonyos esetekben a gép hibázik, és az ember könnyen meg tudja oldani azokat. Ez nehezebb egy tiszta end-to-end rendszernél.
Például az észak-amerikai Waymo és Cruise is sok balesetet szenvedett. Cruise legutóbbi balesete azonban két sérülést okozott, bár az ilyen balesetek elkerülhetetlenek és elfogadhatók az emberi vezetők számára. A balesetet követően azonban a rendszer tévesen ítélte meg a baleset helyét és a sérültek helyét, és húzódzkodó üzemmódba rontott, ami miatt a sérültek hosszan húzódtak. Ez a viselkedés elfogadhatatlan bármely normál emberi vezető számára. Ez nem fog megtörténni, és az eredmények nagyon rosszak lesznek.
Továbbá ez egy ébresztő, hogy alaposan át kell gondolnunk, hogyan kerülhetjük el ezt a helyzetet az autonóm vezetési rendszerek fejlesztése és üzemeltetése során.
4. Tehát jelen pillanatban mik a gyakorlati megoldások a sorozatgyártású vezetéssegítő rendszerek következő generációjához?
Jelenlegi értelmezésem szerint az úgynevezett end-to-end modell vezetésnél a pálya kiírása után hagyományos módszereken alapuló megoldást ad vissza. Alternatív megoldásként a tanulás alapú tervezők és a hagyományos pályatervező algoritmusok egyszerre több pályát adnak ki, majd kiválasztanak egy pályát egy szelektoron keresztül.
Ez a fajta rejtett megoldás és választás korlátozza a kaszkádrendszer teljesítményének felső határát, ha ezt a rendszerarchitektúrát alkalmazzák. Ha ez a módszer továbbra is a tiszta visszacsatolásos tanuláson alapul, akkor előre nem látható kudarcok következnek be, és a biztonság célja egyáltalán nem valósul meg.
Ha megfontoljuk az újraoptimalizálást vagy a hagyományos tervezési módszerekkel történő kiválasztást ezen a kimeneti pályán, akkor ez egyenértékű a tanulásvezérelt módszer által előállított pályával; ezért miért nem optimalizáljuk és keressük közvetlenül ezt a pályát?
Természetesen egyesek azt mondanák, hogy egy ilyen optimalizálási vagy keresési probléma nem konvex, nagy állapottere van, és lehetetlen valós időben futtatni egy járművön belüli rendszeren. Arra kérek mindenkit, hogy alaposan fontolja meg ezt a kérdést: Az elmúlt tíz évben az érzékelési rendszer legalább százszoros számítási teljesítmény-osztalékot kapott, de mi a helyzet a PnC modulunkkal?
Ha azt is megengedjük, hogy a PnC modul nagy számítási teljesítményt használjon, a fejlett optimalizáló algoritmusok elmúlt években elért előrehaladásával együtt, ez a következtetés még mindig helytálló? Az ilyen jellegű problémáknál meg kell fontolnunk, hogy mi a helyes az első elvekből.
5.Hogyan lehet összeegyeztetni az adatvezérelt és a hagyományos módszerek kapcsolatát?
A sakkozás az autonóm vezetéshez nagyon hasonló példa. Idén februárban a Deepmind közzétett egy cikket "Grandmaster-Level Chess Without Search" címmel, amelyben megvitatja, hogy megvalósítható-e az AlphaGo és AlphaZero csak adatvezérelt keresése és az MCTS keresés elhagyása. Az autonóm vezetéshez hasonlóan csak egy hálózatot használnak a műveletek közvetlen kimenetére, miközben az összes további lépést figyelmen kívül hagyja.
A cikk arra a következtetésre jut, hogy a jelentős mennyiségű adat és modellparaméter ellenére meglehetősen ésszerű eredmények érhetők el keresés nélkül. A keresést használó módszerekhez képest azonban jelentős különbségek vannak. Ez különösen hasznos néhány összetett végjáték esetén.
A többlépcsős játékokat igénylő összetett forgatókönyvek vagy sarokesetek esetében ez a hasonlat még mindig megnehezíti a hagyományos optimalizálási vagy keresési algoritmusok teljes elhagyását. A különböző technológiák, például az AlphaZero előnyeinek ésszerű kihasználása a legjobb módja a teljesítmény javításának.
6.Hagyományos módszer = szabályalapú, ha más?
Ezt a fogalmat újra és újra korrigálni kellett, miközben sok emberrel beszéltem. Sokan úgy gondolják, hogy amíg nem pusztán adatvezérelt, addig nem szabályalapú. Például a sakkban a képletek és sakkrekordok ugrásszerű memorizálása szabályalapú, de az AlphaGo-hoz és az AlphaZero-hoz hasonlóan lehetővé teszi a modellnek, hogy az optimalizálás és a keresés révén racionális legyen. Szerintem nem nevezhető szabályalapúnak.
Emiatt jelenleg maga a nagy modell hiányzik, és a kutatók olyan módszerekkel próbálnak tanulásvezérelt modellt nyújtani, mint a CoT. Azonban a tisztán adatvezérelt képfelismerést és megmagyarázhatatlan okokat igénylő feladatokkal ellentétben a vezető személy minden cselekedetének egyértelmű hajtóereje van.
A megfelelő algoritmus-architektúra-tervezés mellett a döntési pályának változóvá kell válnia, és egységesen optimalizáltnak kell lennie a tudományos célok irányítása mellett, nem pedig a paraméterek erőszakos foltozása és módosítása a különböző esetek rögzítése érdekében. Egy ilyen rendszerben természetesen nincs mindenféle keményen kódolt furcsa szabály.
Következtetés
Röviden, a végponttól végpontig ígéretes műszaki út lehet, de a koncepció alkalmazása további kutatást igényel. Szerintem egy rakás adat és modellparaméter nem az egyetlen helyes megoldás, és ha felül akarunk múlni másokat, akkor keményen kell dolgoznunk.
Feladás időpontja: 2024.04.24