Kako definirati end-to-end autonomni sustav vožnje?
Najčešća definicija je da je "end-to-end" sustav sustav koji unosi neobrađene informacije senzora i izravno šalje varijable koje se tiču zadatka. Na primjer, u prepoznavanju slike, CNN se može nazvati "end-to-end" u usporedbi s tradicionalnom metodom značajka + klasifikator.
U zadacima autonomne vožnje unose se podaci iz raznih senzora (kao što su kamere, LiDAR, Radar ili IMU...), a signali upravljanja vozilom (kao što su gas ili kut upravljača) izravno izlaze. Kako bi se razmotrili problemi prilagodbe različitih modela vozila, izlaz se također može ublažiti prema putanji vožnje vozila.
Na temelju ovog temelja pojavili su se i modularni end-to-end koncepti, poput UniAD-a, koji poboljšavaju performanse uvođenjem nadzora relevantnih međuzadataka, uz konačne izlazne upravljačke signale ili putne točke. Međutim, iz tako uske definicije, bit end-to-end trebala bi biti prijenos senzornih informacija bez gubitaka.
Prvo pregledajmo sučelja između senzorskih i PnC modula u sustavima koji nisu end-to-end. Obično otkrivamo objekte s popisa dopuštenih (kao što su automobili, ljudi itd.) te analiziramo i predviđamo njihova svojstva. Također učimo o statičnom okruženju (kao što je struktura ceste, ograničenja brzine, semafori itd.). Da smo detaljniji, detektirali bismo i univerzalne prepreke. Ukratko, informacijski izlaz tih percepcija čini model prikaza složenih scena vožnje.
Međutim, za neke vrlo očite scene trenutna eksplicitna apstrakcija ne može u potpunosti opisati čimbenike koji utječu na ponašanje u vožnji u sceni ili su zadaci koje trebamo definirati previše trivijalni, pa je teško nabrojati sve potrebne zadatke. Stoga, end-to-end sustavi pružaju (možda implicitno) sveobuhvatan prikaz s nadom da će automatski i bez gubitaka djelovati na PnC-ove s tim informacijama. Po mom mišljenju, svi sustavi koji mogu ispuniti ovaj zahtjev mogu se nazvati generaliziranim end-to-end.
Što se tiče drugih pitanja, kao što su neke optimizacije scenarija dinamičke interakcije, vjerujem da barem ne samo end-to-end može riješiti te probleme, a end-to-end možda nije najbolje rješenje. Tradicionalne metode mogu riješiti te probleme, a naravno, kada je količina podataka dovoljno velika, end-to-end može pružiti bolje rješenje.
Neki nesporazumi o autonomnoj vožnji od kraja do kraja
1. Kontrolni signali i međutočke moraju biti emitirani s kraja na kraj.
Ako se slažete s gore razmotrenim širokim konceptom od kraja do kraja, onda je ovaj problem lako razumjeti. End-to-end treba naglasiti prijenos informacija bez gubitaka, a ne izravno ispisivanje količine zadatka. Uzak pristup od kraja do kraja prouzročit će puno nepotrebnih problema i zahtijevati mnogo tajnih rješenja kako bi se osigurala sigurnost.
2. Sustav od kraja do kraja mora se temeljiti na velikim modelima ili čistoj viziji.
Ne postoji nužna veza između autonomne vožnje od kraja do kraja, autonomne vožnje velikih modela i čisto vizualne autonomne vožnje jer su to potpuno neovisni pojmovi; end-to-end sustav ne pokreću nužno veliki modeli, niti ga nužno pokreće čista vizija. od.
3. Dugoročno, je li moguće da gore spomenuti end-to-end sustav u užem smislu postigne autonomnu vožnju iznad razine L3?
Performanse onoga što se trenutno naziva čisti end-to-end FSD daleko su od dovoljnih da zadovolje pouzdanost i stabilnost potrebne na razini L3. Otvorenije rečeno, ako samovozeći sustav želi biti prihvaćen od strane javnosti, ključno je može li javnost prihvatiti da će u nekim slučajevima stroj činiti pogreške, a ljudi ih mogu lako riješiti. Ovo je teže za čisti end-to-end sustav.
Na primjer, i Waymo i Cruise u Sjevernoj Americi imali su mnogo nesreća. Međutim, Cruiseova zadnja nesreća rezultirala je s dvije ozljede, iako su takve nesreće prilično neizbježne i prihvatljive za ljudske vozače. Međutim, nakon ove nesreće, sustav je krivo procijenio mjesto nesreće i lokaciju ozlijeđenih te je prešao na način zaustavljanja, zbog čega su se ozlijeđeni vukli dugo vremena. Takvo ponašanje je neprihvatljivo svakom normalnom ljudskom vozaču. To se neće učiniti, a rezultati će biti jako loši.
Nadalje, ovo je poziv na uzbunu da trebamo pažljivo razmotriti kako izbjeći ovu situaciju tijekom razvoja i rada sustava za autonomnu vožnju.
4. Dakle, u ovom trenutku, koja su praktična rješenja za sljedeću generaciju masovno proizvedenih sustava potpomognute vožnje?
Prema mom trenutnom razumijevanju, kada se koristi takozvani end-to-end model u vožnji, nakon izlaza trajektorije, vratit će rješenje temeljeno na tradicionalnim metodama. Alternativno, planeri temeljeni na učenju i tradicionalni algoritmi za planiranje putanje izlaze više trajektorija istovremeno, a zatim odabiru jednu putanju putem selektora.
Ova vrsta skrivenog rješenja i izbora ograničava gornju granicu performansi ovog kaskadnog sustava ako se usvoji ova arhitektura sustava. Ako se ova metoda i dalje temelji na čistom učenju s povratnom spregom, dogodit će se nepredvidivi kvarovi i cilj sigurnosti neće se uopće postići.
Ako uzmemo u obzir ponovnu optimizaciju ili odabir korištenjem tradicionalnih metoda planiranja na ovoj izlaznoj putanji, to je ekvivalentno putanji proizvedenoj metodom vođenom učenjem; stoga, zašto ne bismo izravno optimizirali i pretražili ovu putanju?
Naravno, neki bi ljudi rekli da je takav problem optimizacije ili pretraživanja nekonveksan, da ima veliki prostor stanja i da ga je nemoguće pokrenuti u stvarnom vremenu na sustavu u vozilu. Preklinjem sve da pažljivo razmotre ovo pitanje: u proteklih deset godina, sustav percepcije dobio je barem sto puta veću dobit od računalne snage, ali što je s našim PnC modulom?
Ako također dopustimo PnC modulu da koristi veliku računalnu snagu, u kombinaciji s nekim napretkom u naprednim optimizacijskim algoritmima posljednjih godina, je li ovaj zaključak još uvijek točan? Za ovu vrstu problema, trebali bismo razmotriti što je ispravno od prvih načela.
5. Kako pomiriti odnos između metoda vođenih podacima i tradicionalnih metoda?
Igranje šaha je primjer vrlo sličan autonomnoj vožnji. U veljači ove godine Deepmind je objavio članak pod nazivom "Šah na razini velemajstora bez pretraživanja", raspravljajući o tome je li izvedivo koristiti samo pretraživanje temeljeno na podacima i napustiti MCTS pretraživanje u AlphaGo i AlphaZero. Slično autonomnoj vožnji, samo se jedna mreža koristi za izravni izlaz radnji, dok se svi sljedeći koraci zanemaruju.
U članku se zaključuje da se, unatoč znatnoj količini podataka i parametara modela, prilično razumni rezultati mogu dobiti i bez korištenja pretraživanja. Međutim, postoje značajne razlike u usporedbi s metodama koje koriste pretraživanje. Ovo je posebno korisno za rješavanje nekih složenih završnih igara.
Za složene scenarije ili kutne slučajeve koji zahtijevaju igre u više koraka, ova analogija još uvijek otežava potpuno napuštanje tradicionalne optimizacije ili algoritama pretraživanja. Razumno korištenje prednosti različitih tehnologija kao što je AlphaZero najbolji je način za poboljšanje performansi.
6.Tradicionalna metoda = temeljena na pravilima ako još?
Morao sam uvijek iznova ispravljati ovaj koncept dok sam razgovarao s mnogim ljudima. Mnogi ljudi vjeruju da se ne temelji na pravilima, sve dok nije isključivo vođen podacima. Na primjer, u šahu se pamćenje formula i šahovskih zapisa napamet temelji na pravilima, ali poput AlphaGo i AlphaZero, daje modelu mogućnost da bude racionalan kroz optimizaciju i pretraživanje. Mislim da se to ne može nazvati temeljenim na pravilima.
Zbog toga trenutno nedostaje sam veliki model, a istraživači pokušavaju osigurati model koji se temelji na učenju putem metoda kao što je CoT. Međutim, za razliku od zadataka koji zahtijevaju čisto prepoznavanje slike temeljeno na podacima i neobjašnjive razloge, svaka radnja osobe koja vozi ima jasnu pokretačku snagu.
Pod odgovarajućim dizajnom arhitekture algoritma, putanja odluke trebala bi postati varijabilna i jednoliko optimizirana pod vodstvom znanstvenih ciljeva, umjesto prisilnog krpanja i prilagođavanja parametara kako bi se popravili različiti slučajevi. Takav sustav prirodno nema sve vrste tvrdo kodiranih čudnih pravila.
Zaključak
Ukratko, end-to-end može biti tehnički put koji obećava, ali kako se koncept primjenjuje zahtijeva više istraživanja. Mislim da hrpa podataka i parametara modela nije jedino ispravno rješenje, a ako želimo nadmašiti druge, moramo i dalje puno raditi.
Vrijeme objave: 24. travnja 2024