Visapusiškos autonominės vairavimo sistemos: vairavimas ateitį

Autonominis vairavimas iki galo

Kaip apibrėžti visapusišką autonominio vairavimo sistemą?

Labiausiai paplitęs apibrėžimas yra toks, kad „nuo galo iki galo“ sistema yra sistema, kuri įveda neapdorotą jutiklio informaciją ir tiesiogiai išveda užduočiai svarbius kintamuosius. Pavyzdžiui, atpažįstant vaizdą, CNN gali būti vadinamas „nuo galo iki galo“, palyginti su tradiciniu funkcijos + klasifikatoriaus metodu.

 

Atliekant savarankiško vairavimo užduotis, įvedami įvairių jutiklių (kamerų, LiDAR, radaro ar IMU...) duomenys, o transporto priemonės valdymo signalai (pvz., droselio arba vairo kampas) išvedami tiesiogiai. Siekiant atsižvelgti į skirtingų transporto priemonių modelių pritaikymo problemas, išvestis taip pat gali būti sumažinta pagal transporto priemonės važiavimo trajektoriją.

 

Remiantis šiuo pagrindu, taip pat atsirado modulinės „end-to-end“ koncepcijos, pvz., „UniAD“, kurios pagerina našumą įdiegdamos atitinkamų tarpinių užduočių priežiūrą, be galutinių išvesties valdymo signalų ar kelio taškų. Tačiau iš tokio siauro apibrėžimo nuo galo iki galo esmė turėtų būti jutiminės informacijos perdavimas be nuostolių.

 

Pirmiausia apžvelkime sąsajas tarp jutiklių ir PnC modulių ne nuo galo iki galo sistemose. Paprastai aptinkame į baltąjį sąrašą įtrauktus objektus (pvz., automobilius, žmones ir pan.) ir analizuojame bei prognozuojame jų savybes. Taip pat sužinome apie statinę aplinką (pvz., kelio struktūrą, greičio apribojimus, šviesoforus ir kt.). Jei būtume detalesni, aptiktume ir universalias kliūtis. Trumpai tariant, šių suvokimų gaunama informacija sudaro sudėtingų vairavimo scenų rodymo modelį.

 

Tačiau kai kurioms labai akivaizdžioms scenoms dabartinė aiški abstrakcija negali visiškai apibūdinti veiksnių, turinčių įtakos vairavimo elgsenai scenoje, arba užduotys, kurias turime apibrėžti, yra per mažos, ir sunku išvardyti visas reikalingas užduotis. Todėl visapusiškos sistemos pateikia (galbūt netiesiogiai) išsamų vaizdą su viltimi automatiškai ir be nuostolių veikti PnC naudojant šią informaciją. Mano nuomone, visas sistemas, kurios gali atitikti šį reikalavimą, galima vadinti apibendrinta nuo galo iki galo.

 

Kalbant apie kitas problemas, pvz., kai kuriuos dinaminės sąveikos scenarijų optimizavimus, manau, kad bent jau ne tik „end-to-end“ galima išspręsti šias problemas, o „nuo galo iki galo“ gali būti ne pats geriausias sprendimas. Tradiciniai metodai gali išspręsti šias problemas, ir, žinoma, kai duomenų kiekis yra pakankamai didelis, galutinis ryšys gali būti geresnis sprendimas.

Kai kurie nesusipratimai dėl autonominio vairavimo iki galo

1. Valdymo signalai ir kelio taškai turi būti išvesti iš vieno galo iki galo.

Jei sutinkate su pirmiau aptarta plačia nuo galo iki galo koncepcija, šią problemą lengva suprasti. Nuo galo iki galo turėtų būti pabrėžiamas informacijos perdavimas be nuostolių, o ne tiesioginis užduoties apimties išvedimas. Siauras nuo galo iki galo metodas sukels daug nereikalingų rūpesčių ir pareikalaus daug slaptų sprendimų, kad būtų užtikrintas saugumas.

2. Nuo galo iki galo sistema turi būti pagrįsta dideliais modeliais arba gryna vizija.

Nėra būtino ryšio tarp visiško autonominio vairavimo, didelio modelio autonominio vairavimo ir grynai vizualaus autonominio vairavimo, nes tai yra visiškai nepriklausomos sąvokos; visapusišką sistemą nebūtinai skatina dideli modeliai ir nebūtinai gryna vizija. iš.

Visapusiška autonominio vairavimo tyrimų ir plėtros sistema

3.Ar įmanoma ilgalaikėje perspektyvoje aukščiau minėta sistema siaurąja prasme pasiekti autonominį vairavimą virš L3 lygio?

 

To, kas šiuo metu vadinama grynu galutiniu FSD, našumas toli gražu nėra pakankamas, kad būtų užtikrintas patikimumas ir stabilumas, reikalingas L3 lygiu. Kalbant atviriau, jei savarankiško vairavimo sistema nori būti priimta visuomenės, svarbiausia yra tai, ar visuomenė gali susitaikyti su tuo, kad tam tikrais atvejais mašina padarys klaidų, o žmonės gali jas lengvai išspręsti. Tai yra sunkiau grynai „end-to-end“ sistemai.

 

Pavyzdžiui, „Waymo“ ir „Cruise“ Šiaurės Amerikoje patyrė daug nelaimingų atsitikimų. Tačiau paskutinė Cruise'o avarija baigėsi dviem sužalojimais, nors tokios avarijos yra gana neišvengiamos ir priimtinos vairuotojams. Tačiau po šios avarijos sistema neteisingai įvertino nelaimės vietą ir sužeistųjų buvimo vietą ir sumažino traukimo režimą, todėl sužeistieji buvo ilgai tempiami. Toks elgesys nepriimtinas jokiam normaliam vairuotojui. Tai nebus padaryta, o rezultatai bus labai blogi.

 

Be to, tai yra pavojaus signalas, kad kurdami ir eksploatuodami autonominio vairavimo sistemas turėtume atidžiai apsvarstyti, kaip šios situacijos išvengti.

4. Taigi, kokie yra praktiniai naujos kartos masinės gamybos pagalbinių vairavimo sistemų sprendimai?

 

Mano dabartiniu supratimu, naudojant vadinamąjį end-to-end modelį vairuojant, išvedęs trajektoriją, jis grąžins tradiciniais metodais paremtą sprendimą. Arba mokymu pagrįsti planuotojai ir tradiciniai trajektorijų planavimo algoritmai vienu metu išveda kelias trajektorijas ir pasirenka vieną trajektoriją per parinkiklį.

 

Toks slaptas sprendimas ir pasirinkimas riboja viršutinę šios kaskadinės sistemos veikimo ribą, jei bus priimta ši sistemos architektūra. Jei šis metodas vis dar grindžiamas grynu grįžtamojo ryšio mokymusi, įvyks nenuspėjamų gedimų, o tikslas būti saugiam apskritai nebus pasiektas.

 

Jei apsvarstysime galimybę iš naujo optimizuoti arba pasirinkti naudojant tradicinius planavimo metodus šioje išvesties trajektorijoje, tai yra lygiavertė trajektorijai, sukurtai mokymosi orientuoto metodo; todėl kodėl mes tiesiogiai neoptimizuojame ir neieškome šios trajektorijos?

 

Žinoma, kai kurie žmonės pasakytų, kad tokia optimizavimo ar paieškos problema nėra išgaubta, turi didelę būsenų erdvę ir jos neįmanoma vykdyti realiuoju laiku transporto priemonėje esančioje sistemoje. Prašau visų atidžiai apsvarstyti šį klausimą: per pastaruosius dešimt metų suvokimo sistema gavo bent šimtą kartų didesnį skaičiavimo galios dividendą, bet kaip dėl mūsų PnC modulio?

 

Jei taip pat leisime PnC moduliui naudoti didelę skaičiavimo galią kartu su tam tikra pažangių optimizavimo algoritmų pažanga pastaraisiais metais, ar ši išvada vis dar teisinga? Esant tokiai problemai, turėtume apsvarstyti, kas yra teisinga iš pirmųjų principų.

5.Kaip suderinti duomenimis pagrįstų ir tradicinių metodų ryšį?

 

Žaidimas šachmatais yra pavyzdys, labai panašus į autonominį vairavimą. Šių metų vasarį „Deepmind“ paskelbė straipsnį „Grandmaster-Level Chess Without Search“, kuriame aptarė, ar įmanoma naudoti tik duomenimis pagrįstą paiešką ir atsisakyti MCTS paieškos „AlphaGo“ ir „AlphaZero“. Panašiai kaip autonominis vairavimas, tiesioginiam veiksmams išvesti naudojamas tik vienas tinklas, o visi tolesni veiksmai yra ignoruojami.

 

Straipsnyje daroma išvada, kad nepaisant didelio duomenų kiekio ir modelio parametrų, gana pagrįstus rezultatus galima gauti nenaudojant paieškos. Tačiau yra didelių skirtumų, palyginti su paieškos metodais. Tai ypač naudinga sprendžiant kai kuriuos sudėtingus galutinius žaidimus.

 

Dėl sudėtingų scenarijų ar kampinių atvejų, kuriems reikalingi kelių žingsnių žaidimai, dėl šios analogijos vis tiek sunku visiškai atsisakyti tradicinių optimizavimo ar paieškos algoritmų. Tinkamai išnaudoti įvairių technologijų, pvz., AlphaZero, pranašumus yra geriausias būdas pagerinti našumą.

Transporto priemonės valdymas

6.Tradicinis metodas = taisyklė pagrįstas, jei kitaip?

 

Man teko vėl ir vėl taisyti šią sąvoką kalbėdamas su daugeliu žmonių. Daugelis žmonių mano, kad tol, kol jis nėra pagrįstas vien duomenimis, jis nėra pagrįstas taisyklėmis. Pavyzdžiui, šachmatų atveju formulių ir šachmatų įrašų įsiminimas pagal paskirtį yra pagrįstas taisyklėmis, tačiau, kaip ir AlphaGo ir AlphaZero, tai suteikia modeliui galimybę būti racionaliam per optimizavimą ir paiešką. Nemanau, kad tai gali būti vadinama taisyklėmis.

 

Dėl šios priežasties šiuo metu trūksta paties didelio modelio, o tyrėjai bando pateikti mokymu pagrįstą modelį taikydami tokius metodus kaip CoT. Tačiau, skirtingai nuo užduočių, kurioms reikalingas vien duomenimis pagrįsto vaizdo atpažinimas ir nepaaiškinamos priežastys, kiekvienas vairuojančio žmogaus veiksmas turi aiškią varomąją jėgą.

 

Taikant tinkamą algoritmo architektūros projektą, sprendimo trajektorija turėtų tapti kintama ir būti tolygiai optimizuota vadovaujantis moksliniais tikslais, o ne priverstinai pataisyti ir koreguoti parametrus, kad būtų ištaisyti skirtingi atvejai. Natūralu, kad tokioje sistemoje nėra visokių sunkiai užkoduotų keistų taisyklių.

Išvada

Trumpai tariant, nuo galo iki galo gali būti daug žadantis techninis kelias, tačiau kaip koncepcija taikoma, reikia daugiau tyrimų. Manau, kad daugybė duomenų ir modelio parametrų nėra vienintelis teisingas sprendimas, o jei norime pranokti kitus, turime ir toliau sunkiai dirbti.


Paskelbimo laikas: 2024-04-24