Kako definisati sistem autonomne vožnje od kraja do kraja?
Najčešća definicija je da je "end-to-end" sistem sistem koji unosi neobrađene informacije senzora i direktno izlazi varijable koje se tiču zadatka. Na primjer, u prepoznavanju slika, CNN se može nazvati "od kraja do kraja" u poređenju sa tradicionalnom metodom karakteristika + klasifikator.
U zadacima autonomne vožnje, podaci iz različitih senzora (kao što su kamere, LiDAR, Radar ili IMU...) se unose, a signali upravljanja vozilom (kao što su gas ili ugao upravljača) se direktno izlaze. Da bi se razmotrili problemi prilagođavanja različitih modela vozila, izlaz se takođe može smanjiti na putanju vožnje vozila.
Na osnovu ove osnove, pojavili su se i modularni end-to-end koncepti, kao što je UniAD, koji poboljšavaju performanse uvođenjem nadzora nad relevantnim međuzadacima, pored konačnih izlaznih kontrolnih signala ili međutočaka. Međutim, iz tako uske definicije, suština end-to-end trebala bi biti prijenos senzornih informacija bez gubitaka.
Hajde da prvo pregledamo interfejse između senzorskih i PnC modula u sistemima koji nisu end-to-end. Obično otkrivamo objekte sa bijele liste (kao što su automobili, ljudi, itd.) i analiziramo i predviđamo njihova svojstva. Također učimo o statičkom okruženju (kao što je struktura puta, ograničenja brzine, semafori, itd.). Da smo detaljniji, otkrili bismo i univerzalne prepreke. Ukratko, informacije koje izlaze iz ovih percepcija čine model prikaza složenih scena vožnje.
Međutim, za neke vrlo očigledne scene, trenutna eksplicitna apstrakcija ne može u potpunosti opisati faktore koji utiču na ponašanje vožnje u sceni, ili su zadaci koje trebamo definirati previše trivijalni, te je teško nabrojati sve potrebne zadatke. Stoga, end-to-end sistemi pružaju (možda implicitno) sveobuhvatnu reprezentaciju sa nadom da će automatski i bez gubitaka djelovati na PnC-ove sa ovim informacijama. Po mom mišljenju, svi sistemi koji mogu ispuniti ovaj zahtjev mogu se nazvati generaliziranim end-to-end.
Što se tiče drugih pitanja, kao što su neke optimizacije scenarija dinamičke interakcije, vjerujem da barem ne samo end-to-end može riješiti ove probleme, a end-to-end možda nije najbolje rješenje. Tradicionalne metode mogu riješiti ove probleme, i naravno, kada je količina podataka dovoljno velika, end-to-end može pružiti bolje rješenje.
Neki nesporazumi oko autonomne vožnje od kraja do kraja
1. Kontrolni signali i putne točke moraju se emitovati kako bi bili s kraja na kraj.
Ako se slažete sa širokim konceptom od kraja do kraja koji je gore razmotren, onda je ovaj problem lako razumjeti. S kraja na kraj treba naglasiti prijenos informacija bez gubitaka umjesto direktnog izlaza volumena zadatka. Uski pristup od kraja do kraja će uzrokovati mnogo nepotrebnih problema i zahtijevati mnogo prikrivenih rješenja kako bi se osigurala sigurnost.
2. Sistem od kraja do kraja mora biti zasnovan na velikim modelima ili čistoj viziji.
Ne postoji neophodna veza između autonomne vožnje od kraja do kraja, autonomne vožnje velikih modela i čisto vizuelne autonomne vožnje jer su to potpuno nezavisni koncepti; end-to-end sistem nije nužno vođen velikim modelima, niti je nužno vođen čistom vizijom. of.
3. Dugoročno gledano, da li je moguće da gore navedeni end-to-end sistem u užem smislu postigne autonomnu vožnju iznad nivoa L3?
Performanse onoga što se trenutno naziva čisti end-to-end FSD daleko su od dovoljne da zadovolje pouzdanost i stabilnost potrebne na nivou L3. Da budemo otvorenije, ako sistem samostalnog upravljanja želi da bude prihvaćen od strane javnosti, ključno je da li javnost može prihvatiti da će u nekim slučajevima mašina praviti greške i da ih ljudi lako mogu rešiti. Ovo je teže za čisti end-to-end sistem.
Na primjer, i Waymo i Cruise u Sjevernoj Americi imali su mnogo nesreća. Međutim, posljednja Cruiseova nesreća rezultirala je s dvije ozljede, iako su takve nesreće prilično neizbježne i prihvatljive za ljudske vozače. Međutim, nakon ove nesreće, sistem je pogrešno procijenio lokaciju nesreće i lokaciju ozlijeđenih i prešao na pull-over mod, zbog čega su se povrijeđeni dugo vlačili. Ovo ponašanje je neprihvatljivo za svakog normalnog ljudskog vozača. To neće biti učinjeno, a rezultati će biti veoma loši.
Nadalje, ovo je poziv na buđenje da treba pažljivo razmotriti kako izbjeći ovu situaciju tokom razvoja i rada sistema autonomne vožnje.
4. Dakle, u ovom trenutku, koja su praktična rješenja za sljedeću generaciju masovno proizvedenih sistema potpomognute vožnje?
Prema mom trenutnom shvaćanju, kada se koristi takozvani end-to-end model u vožnji, nakon izlaza putanje vraća rješenje bazirano na tradicionalnim metodama. Alternativno, planeri zasnovani na učenju i tradicionalni algoritmi za planiranje putanje daju više putanja istovremeno, a zatim biraju jednu putanju kroz selektor.
Ova vrsta prikrivenog rješenja i izbora ograničava gornju granicu performansi ovog kaskadnog sistema ako se usvoji ova arhitektura sistema. Ako je ova metoda i dalje zasnovana na čistom povratnom učenju, doći će do nepredvidivih neuspjeha i cilj sigurnosti uopće neće biti postignut.
Ako razmotrimo ponovnu optimizaciju ili odabir koristeći tradicionalne metode planiranja na ovoj izlaznoj putanji, to je ekvivalentno putanji proizvedenoj metodom vođenom učenjem; stoga, zašto ne bismo direktno optimizirali i pretražili ovu putanju?
Naravno, neki ljudi bi rekli da je takav problem optimizacije ili pretraživanja nekonveksan, da ima veliki prostor stanja i da je nemoguće pokrenuti u realnom vremenu na sistemu u vozilu. Molim sve da pažljivo razmotre ovo pitanje: U proteklih deset godina, sistem percepcije je dobio barem sto puta veću računsku moć dividende, ali šta je sa našim PnC modulom?
Ako također dopustimo PnC modulu da koristi veliku računarsku snagu, u kombinaciji s nekim napretkom u naprednim optimizacijskim algoritmima posljednjih godina, da li je ovaj zaključak još uvijek tačan? Za ovu vrstu problema, trebalo bi da razmotrimo šta je ispravno od prvih principa.
5. Kako pomiriti odnos između metoda zasnovanih na podacima i tradicionalnih metoda?
Igranje šaha je primjer vrlo sličan autonomnoj vožnji. U februaru ove godine, Deepmind je objavio članak pod nazivom "Šah na nivou velemajstora bez pretrage", raspravljajući o tome da li je izvodljivo koristiti samo vođenu podacima i napustiti MCTS pretragu u AlphaGo i AlphaZero. Slično kao kod autonomne vožnje, samo jedna mreža se koristi za direktan izlaz akcija, dok se svi naredni koraci zanemaruju.
U članku se zaključuje da se, unatoč velikoj količini podataka i parametara modela, mogu dobiti prilično razumni rezultati bez korištenja pretrage. Međutim, postoje značajne razlike u poređenju sa metodama koje koriste pretragu. Ovo je posebno korisno za rješavanje nekih složenih završnica.
Za složene scenarije ili kutne slučajeve koji zahtijevaju igre u više koraka, ova analogija još uvijek otežava potpuno napuštanje tradicionalnih algoritama optimizacije ili pretraživanja. Razumno korištenje prednosti različitih tehnologija kao što je AlphaZero je najbolji način za poboljšanje performansi.
6.Tradicionalna metoda = bazirana na pravilima ako ne?
Morao sam da ispravljam ovaj koncept iznova i iznova dok sam razgovarao sa mnogim ljudima. Mnogi ljudi vjeruju da sve dok nije isključivo vođen podacima, nije zasnovan na pravilima. Na primjer, u šahu, pamćenje formula i šahovskih zapisa napamet je bazirano na pravilima, ali poput AlphaGo i AlphaZero, daje modelu mogućnost da bude racionalan kroz optimizaciju i pretragu. Mislim da se to ne može nazvati zasnovanim na pravilima.
Zbog toga, sam veliki model trenutno nedostaje, a istraživači pokušavaju osigurati model vođen učenjem pomoću metoda kao što je CoT. Međutim, za razliku od zadataka koji zahtijevaju čisto prepoznavanje slike na temelju podataka i neobjašnjivih razloga, svaka radnja osobe koja vozi ima jasnu pokretačku snagu.
Pod odgovarajućim dizajnom arhitekture algoritama, putanja odluke treba da postane varijabilna i da bude ujednačeno optimizovana pod vođstvom naučnih ciljeva, a ne nasilno krpljenje i prilagođavanje parametara da bi se popravili različiti slučajevi. Takav sistem prirodno nema sve vrste tvrdo kodiranih čudnih pravila.
Zaključak
Ukratko, end-to-end može biti obećavajući tehnički put, ali način na koji se koncept primjenjuje zahtijeva više istraživanja. Mislim da gomila podataka i parametara modela nije jedino ispravno rješenje, a ako želimo nadmašiti druge, moramo nastaviti vrijedno raditi.
Vrijeme objave: Apr-24-2024