End-to-End outonome bestuurstelsels: Driving the Future

Outonome bestuur van einde tot einde

Hoe om 'n end-tot-end outonome bestuurstelsel te definieer?

Die mees algemene definisie is dat 'n "end-tot-end"-stelsel 'n stelsel is wat rou sensorinligting invoer en veranderlikes wat van belang is vir die taak direk uitstuur. Byvoorbeeld, in beeldherkenning kan CNN "end-tot-end" genoem word in vergelyking met die tradisionele kenmerk + klassifiseerder-metode.

 

In outonome bestuurstake word data vanaf verskeie sensors (soos kameras, LiDAR, Radar of IMU...) ingevoer, en voertuigbeheerseine (soos versneller of stuurwielhoek) word direk uitgevoer. Om die aanpassingskwessies van verskillende voertuigmodelle in ag te neem, kan die uitset ook verslap word na die voertuig se rittrajek.

 

Gebaseer op hierdie grondslag het modulêre end-tot-end-konsepte ook na vore gekom, soos UniAD, wat werkverrigting verbeter deur toesig oor relevante intermediêre take in te stel, benewens die finale uitsetbeheerseine of -wegpunte. Uit so 'n eng definisie behoort die essensie van end-tot-end egter die verlieslose oordrag van sensoriese inligting te wees.

 

Kom ons hersien eers die koppelvlakke tussen waarnemings- en PnC-modules in nie-end-tot-end-stelsels. Gewoonlik bespeur ons voorwerpe op die witlys (soos motors, mense, ens.) en analiseer en voorspel hul eienskappe. Ons leer ook van die statiese omgewing (soos padstruktuur, spoedbeperkings, verkeersligte, ens.). As ons meer gedetailleerd was, sou ons ook universele struikelblokke opspoor. Kortom, die inligtingsuitset deur hierdie persepsies vorm 'n vertoonmodel van komplekse rytonele.

 

Vir sommige baie ooglopende tonele kan die huidige eksplisiete abstraksie egter nie die faktore wat bestuursgedrag in die toneel beïnvloed volledig beskryf nie, of die take wat ons moet definieer is te onbenullig, en dit is moeilik om alle vereiste take op te som. Daarom bied end-tot-end-stelsels 'n (dalk implisiet) omvattende voorstelling met die hoop om outomaties en verliesloos op PnC's op te tree met hierdie inligting. Na my mening kan alle stelsels wat aan hierdie vereiste voldoen, veralgemeen end-tot-end genoem word.

 

Wat ander kwessies betref, soos sommige optimaliserings van dinamiese interaksie-scenario's, glo ek dat ten minste nie net end-tot-end hierdie probleme kan oplos nie, en end-tot-end is dalk nie die beste oplossing nie. Tradisionele metodes kan hierdie probleme oplos, en natuurlik, wanneer die hoeveelheid data groot genoeg is, kan end-tot-end 'n beter oplossing bied.

Sommige misverstande oor outonome bestuur van einde tot einde

1. Beheerseine en waypoints moet uitgestuur word om end-tot-end te wees.

As jy saamstem met die breë end-tot-end-konsep wat hierbo bespreek is, dan is hierdie probleem maklik om te verstaan. Einde tot einde moet die verlieslose oordrag van inligting beklemtoon eerder as om die taakvolume direk uit te voer. ’n Nou end-tot-end-benadering sal baie onnodige moeilikheid veroorsaak en baie geheime oplossings verg om veiligheid te verseker.

2.Die end-tot-end-stelsel moet gebaseer wees op groot modelle of suiwer visie.

Daar is geen noodwendige verband tussen end-tot-end outonome bestuur, groot-model outonome bestuur, en suiwer visuele outonome bestuur nie, want dit is heeltemal onafhanklike konsepte; ’n end-tot-end-stelsel word nie noodwendig deur groot modelle gedryf nie, en word ook nie noodwendig deur suiwer visie aangedryf nie. van.

End-to-end outonome bestuur navorsing en ontwikkeling stelsel

3.Is dit op die lang termyn moontlik vir die bogenoemde end-tot-end-stelsel in 'n eng sin om outonome bestuur bo die L3-vlak te bereik?

 

Die prestasie van wat tans suiwer end-tot-end FSD genoem word, is ver van voldoende om te voldoen aan die betroubaarheid en stabiliteit wat op die L3-vlak vereis word. Om dit meer reguit te stel, as die selfbestuurstelsel deur die publiek aanvaar wil word, is die sleutel of die publiek kan aanvaar dat die masjien in sommige gevalle foute sal maak, en mense kan dit maklik oplos. Dit is moeiliker vir 'n suiwer end-tot-end-stelsel.

 

Byvoorbeeld, beide Waymo en Cruise in Noord-Amerika het baie ongelukke gehad. Cruise se laaste ongeluk het egter twee beserings tot gevolg gehad, hoewel sulke ongelukke redelik onvermydelik en aanvaarbaar is vir menslike bestuurders. Na hierdie ongeluk het die stelsel egter die ligging van die ongeluk en die ligging van die beseerdes verkeerd beoordeel en na oortrekmodus afgegradeer, wat veroorsaak het dat die beseerdes vir 'n lang tyd gesleep is. Hierdie gedrag is onaanvaarbaar vir enige normale menslike bestuurder. Dit sal nie gedoen word nie, en die resultate sal baie sleg wees.

 

Verder is dit 'n wekroep wat ons noukeurig moet oorweeg hoe om hierdie situasie te vermy tydens die ontwikkeling en werking van outonome bestuurstelsels.

4.So op hierdie oomblik, wat is die praktiese oplossings vir die volgende generasie van massavervaardigde geassisteerde bestuurstelsels?

 

Volgens my huidige begrip, wanneer die sogenaamde end-tot-end-model in bestuur gebruik word, sal dit na die uitset van die trajek 'n oplossing gee wat op tradisionele metodes gebaseer is. Alternatiewelik voer leergebaseerde beplanners en tradisionele trajekbeplanningsalgoritmes verskeie trajekte gelyktydig uit en kies dan een trajek deur 'n kieser.

 

Hierdie soort geheime oplossing en keuse beperk die boonste limiet van die werkverrigting van hierdie kaskadestelsel as hierdie stelselargitektuur aangeneem word. As hierdie metode steeds op suiwer terugvoerleer gebaseer is, sal onvoorspelbare mislukkings voorkom en die doelwit om veilig te wees sal glad nie bereik word nie.

 

As ons dit oorweeg om te heroptimaliseer of te selekteer deur gebruik te maak van tradisionele beplanningsmetodes op hierdie uitsettrajek, is dit gelykstaande aan die trajek wat deur die leergedrewe metode geproduseer word; daarom, hoekom optimaliseer en soek ons ​​nie direk hierdie baan nie?

 

Natuurlik sal sommige mense sê dat so 'n optimaliserings- of soekprobleem nie-konveks is, 'n groot staatspasie het en onmoontlik is om intyds op 'n in-voertuigstelsel te hardloop. Ek smeek almal om hierdie vraag noukeurig te oorweeg: In die afgelope tien jaar het die persepsiestelsel minstens honderd keer die rekenkragdividend ontvang, maar wat van ons PnC-module?

 

As ons ook toelaat dat die PnC-module groot rekenaarkrag gebruik, gekombineer met 'n paar vooruitgang in gevorderde optimaliseringsalgoritmes in onlangse jare, is hierdie gevolgtrekking steeds korrek? Vir hierdie soort probleem moet ons oorweeg wat korrek is uit eerste beginsels.

5.Hoe om die verhouding tussen datagedrewe en tradisionele metodes te versoen?

 

Skaak speel is 'n voorbeeld wat baie soortgelyk is aan outonome bestuur. In Februarie vanjaar het Deepmind 'n artikel genaamd "Grandmaster-Level Chess Without Search" gepubliseer en bespreek of dit haalbaar is om slegs data-gedrewe te gebruik en MCTS-soektog in AlphaGo en AlphaZero te laat vaar. Soortgelyk aan outonome bestuur, word slegs een netwerk gebruik om aksies direk uit te voer, terwyl alle daaropvolgende stappe geïgnoreer word.

 

Die artikel kom tot die gevolgtrekking dat, ten spyte van aansienlike hoeveelhede data en modelparameters, redelik redelike resultate verkry kan word sonder om 'n soektog te gebruik. Daar is egter beduidende verskille in vergelyking met metodes wat soektog gebruik. Dit is veral nuttig vir die hantering van sommige komplekse eindspeletjies.

 

Vir komplekse scenario's of hoekgevalle wat multi-stap speletjies vereis, maak hierdie analogie dit steeds moeilik om tradisionele optimalisering of soekalgoritmes heeltemal te laat vaar. Om die voordele van verskeie tegnologieë soos AlphaZero redelik te benut, is die beste manier om werkverrigting te verbeter.

Voertuigbeheer

6.Tradisionele metode = reëlgebaseer indien anders?

 

Ek moes hierdie konsep oor en oor regstel terwyl ek met baie mense gepraat het. Baie mense glo dat solank dit nie suiwer data-gedrewe is nie, dit nie op reëls gebaseer is nie. Byvoorbeeld, in skaak is die memorisering van formules en skaakrekords deur middel van reëls gebaseer, maar soos AlphaGo en AlphaZero gee dit die model die vermoë om rasioneel te wees deur optimalisering en soektog. Ek dink nie dit kan reël-gebaseerd genoem word nie.

 

As gevolg hiervan ontbreek die groot model self tans, en navorsers probeer om 'n leergedrewe model te verskaf deur metodes soos CoT. Anders as take wat suiwer data-gedrewe beeldherkenning en onverklaarbare redes vereis, het elke aksie van 'n persoon wat bestuur egter 'n duidelike dryfveer.

 

Onder die toepaslike algoritme-argitektuurontwerp moet die besluitbaan veranderlik word en eenvormig geoptimaliseer word onder die leiding van wetenskaplike doelwitte, eerder as om parameters met geweld te pleister en aan te pas om verskillende gevalle reg te stel. So 'n stelsel het natuurlik nie allerhande hardgekodeerde vreemde reëls nie.

Gevolgtrekking

Kortom, end-tot-end kan 'n belowende tegniese roete wees, maar hoe die konsep toegepas word, verg meer navorsing. Ek dink ’n klomp data- en modelparameters is nie die enigste korrekte oplossing nie, en as ons ander wil oortref, moet ons aanhou hard werk.


Postyd: 24-Apr-2024