Kuinka määritellä päästä päähän autonominen ajojärjestelmä?
Yleisin määritelmä on, että "päästä päähän" -järjestelmä on järjestelmä, joka syöttää anturitietoja ja tulostaa suoraan tehtävää koskevat muuttujat. Esimerkiksi kuvantunnistuksessa CNN:tä voidaan kutsua "päästä päähän" verrattuna perinteiseen ominaisuus + luokitin -menetelmään.
Autonomisissa ajotehtävissä eri antureista (kuten kameroista, LiDAR:sta, tutkasta tai IMU:sta...) tulevat tiedot ja ajoneuvon ohjaussignaalit (kuten kaasun tai ohjauspyörän kulma) lähetetään suoraan. Eri ajoneuvomallien sopeutumisongelmien huomioon ottamiseksi tehoa voidaan myös rentouttaa ajoneuvon ajoradan mukaan.
Tämän perustan pohjalta on syntynyt myös modulaarisia päästä päähän -konsepteja, kuten UniAD, jotka parantavat suorituskykyä ottamalla käyttöön asiaankuuluvien välitehtävien valvonnan lopullisten lähtöohjaussignaalien tai reittipisteiden lisäksi. Kuitenkin näin kapeasta määritelmästä päästä päähän -periaatteen pitäisi olla aistiinformaation häviötön välittäminen.
Tarkastellaan ensin tunnistus- ja PnC-moduulien välisiä rajapintoja ei-päästä päähän -järjestelmissä. Yleensä havaitsemme sallittujen luetteloon lisätyt kohteet (kuten autot, ihmiset jne.) ja analysoimme ja ennustamme niiden ominaisuuksia. Opimme myös staattisesta ympäristöstä (kuten tierakenteesta, nopeusrajoituksista, liikennevaloista jne.). Jos olisimme yksityiskohtaisempia, havaitsisimme myös yleismaailmallisia esteitä. Lyhyesti sanottuna näiden havaintojen tuottama tieto muodostaa monimutkaisten ajokohtausten näyttömallin.
Joidenkin hyvin ilmeisten kohtausten kohdalla nykyinen eksplisiittinen abstraktio ei kuitenkaan pysty täysin kuvaamaan tekijöitä, jotka vaikuttavat ajokäyttäytymiseen kohtauksessa, tai tehtävät, jotka meidän on määritettävä, ovat liian triviaaleja, ja on vaikea luetella kaikkia vaadittuja tehtäviä. Siksi päästä päähän -järjestelmät tarjoavat (ehkä implisiittisesti) kattavan esityksen toivoen, että ne voivat toimia automaattisesti ja häviöttömästi PnC:issä näiden tietojen avulla. Mielestäni kaikkia järjestelmiä, jotka voivat täyttää tämän vaatimuksen, voidaan kutsua yleistetyksi päästä päähän.
Mitä tulee muihin ongelmiin, kuten joihinkin dynaamisten vuorovaikutusskenaarioiden optimointiin, uskon, että ainakin päästä-päähän ei voi ratkaista näitä ongelmia, ja päästä päähän - ei välttämättä ole paras ratkaisu. Perinteiset menetelmät voivat ratkaista nämä ongelmat, ja tietysti, kun dataa on tarpeeksi suuri, päästä-päähän voi tarjota parempi ratkaisu.
Jotkut väärinkäsitykset päästä päähän autonomisesta ajamisesta
1. Ohjaussignaalien ja reittipisteiden tulee olla päästä päähän.
Jos olet samaa mieltä yllä käsitellystä laajasta päästä päähän -käsitteeseen, tämä ongelma on helppo ymmärtää. Päästä päähän tulisi korostaa häviötöntä tiedonsiirtoa sen sijaan, että tulostettaisiin suoraan tehtävämäärä. Kapea päästä päähän -lähestymistapa aiheuttaa paljon tarpeettomia ongelmia ja vaatii paljon salaisia ratkaisuja turvallisuuden takaamiseksi.
2. Päästä päähän -järjestelmän tulee perustua suuriin malleihin tai puhtaaseen visioon.
Päästä päähän autonomisen ajon, suurten mallien autonomisen ajon ja puhtaasti visuaalisen autonomisen ajon välillä ei ole välttämätöntä yhteyttä, koska ne ovat täysin itsenäisiä käsitteitä. päästä päähän -järjestelmää ei välttämättä ohjaa suuret mallit, eikä sitä välttämättä ohjaa puhdas visio. /.
3. Onko yllä mainitulla päästä päähän -järjestelmällä mahdollista suppeassa mielessä pitkällä aikavälillä saavuttaa autonominen ajo L3-tason yläpuolella?
Sen, mitä tällä hetkellä kutsutaan puhtaaksi päästä päähän FSD:ksi, suorituskyky ei ole läheskään riittävä täyttämään L3-tasolla vaaditun luotettavuuden ja vakauden. Suoraan sanottuna, jos itseajava järjestelmä haluaa tulla yleisön hyväksytyksi, ratkaisevaa on, voiko yleisö hyväksyä sen, että joissakin tapauksissa kone tekee virheitä ja ihmiset voivat helposti ratkaista ne. Tämä on vaikeampaa puhtaassa päästä päähän -järjestelmässä.
Esimerkiksi sekä Waymolla että Cruisella Pohjois-Amerikassa on ollut monia onnettomuuksia. Cruisen viimeinen onnettomuus johti kuitenkin kahteen loukkaantumiseen, vaikka sellaiset onnettomuudet ovat ihmiskuljettajille melko väistämättömiä ja hyväksyttäviä. Tämän onnettomuuden jälkeen järjestelmä kuitenkin arvioi väärin onnettomuuden sijainnin ja loukkaantuneiden sijainnin ja alensi luokan vetotilaan, jolloin loukkaantuneita raahattiin pitkään. Tätä käyttäytymistä ei voi hyväksyä normaalille ihmiskuljettajalle. Sitä ei tehdä, ja tulokset ovat erittäin huonot.
Lisäksi tämä on herätys siitä, että meidän tulee harkita tarkasti, kuinka tämä tilanne vältetään autonomisten ajojärjestelmien kehittämisen ja käytön aikana.
4. Mitkä ovat siis tällä hetkellä käytännön ratkaisut seuraavan sukupolven massatuotetuille ajoavusteisille järjestelmille?
Nykyisen ymmärrykseni mukaan käytettäessä ns. end-to-end -mallia ajamisessa, se palauttaa liikeradan tulostamisen jälkeen perinteisiin menetelmiin perustuvan ratkaisun. Vaihtoehtoisesti oppimiseen perustuvat suunnittelijat ja perinteiset liikeradan suunnittelualgoritmit tuottavat useita lentoratoja samanaikaisesti ja valitsevat sitten yhden liikeradan valitsimen avulla.
Tällainen salainen ratkaisu ja valinta rajoittaa tämän kaskadijärjestelmän suorituskyvyn ylärajaa, jos tämä järjestelmäarkkitehtuuri otetaan käyttöön. Jos tämä menetelmä perustuu edelleen puhtaaseen palauteoppimiseen, tapahtuu arvaamattomia epäonnistumisia ja turvallisuuden tavoitetta ei saavuteta ollenkaan.
Jos harkitsemme uudelleenoptimointia tai valintaa käyttämällä perinteisiä suunnittelumenetelmiä tällä tulosradalla, tämä vastaa oppimislähtöisen menetelmän tuottamaa liikerataa; miksi emme siis optimoi ja hae suoraan tätä kehityskulkua?
Tietenkin jotkut ihmiset sanoisivat, että tällainen optimointi- tai hakuongelma on ei-kupera, sillä on suuri tila-avaruus ja että sitä on mahdotonta suorittaa reaaliajassa ajoneuvon sisäisessä järjestelmässä. Pyydän kaikkia harkitsemaan huolellisesti tätä kysymystä: Viimeisten kymmenen vuoden aikana havaintojärjestelmä on saanut vähintään satakertaisen laskentatehon osingon, mutta entä PnC-moduulimme?
Jos sallimme myös PnC-moduulin käyttää suurta laskentatehoa yhdistettynä edistyneisiin optimointialgoritmeihin viime vuosina, onko tämä johtopäätös edelleen oikea? Tällaisessa ongelmassa meidän pitäisi pohtia, mikä on oikein ensimmäisistä periaatteista lähtien.
5.Kuinka sovittaa yhteen datalähtöisten ja perinteisten menetelmien suhde?
Shakin pelaaminen on hyvin samanlainen esimerkki kuin autonominen ajaminen. Tämän vuoden helmikuussa Deepmind julkaisi artikkelin nimeltä "Grandmaster-Level Chess Without Search", jossa pohdittiin, onko mahdollista käyttää vain tietopohjaista hakua ja luopua MCTS-hausta AlphaGossa ja AlphaZerossa. Autonomisen ajon tapaan vain yhtä verkkoa käytetään suoraan toimintojen tulostamiseen, kun taas kaikki seuraavat vaiheet jätetään huomiotta.
Artikkelissa todetaan, että huomattavista tietomääristä ja malliparametreista huolimatta melko kohtuullisia tuloksia voidaan saada ilman hakua. Hakumenetelmiin verrattuna on kuitenkin merkittäviä eroja. Tämä on erityisen hyödyllistä joissakin monimutkaisissa loppupeleissä.
Monimutkaisissa skenaarioissa tai kulmatapauksissa, jotka vaativat monivaiheisia pelejä, tämä analogia vaikeuttaa silti perinteisten optimointi- tai hakualgoritmien kokonaan luopumista. Erilaisten teknologioiden, kuten AlphaZeron, etujen järkevä hyödyntäminen on paras tapa parantaa suorituskykyä.
6. Perinteinen menetelmä = sääntöpohjainen jos muuten?
Olen joutunut oikaisemaan tätä käsitystä yhä uudelleen ja uudelleen puhuessani monien ihmisten kanssa. Monet ihmiset uskovat, että niin kauan kuin se ei ole puhtaasti tietopohjainen, se ei ole sääntöpohjainen. Esimerkiksi shakissa kaavojen ja shakkitietueiden ulkoa muistiin ottaminen on sääntöpohjaista, mutta kuten AlphaGo ja AlphaZero, se antaa mallille mahdollisuuden olla rationaalinen optimoinnin ja haun avulla. En usko, että sitä voi kutsua sääntöpohjaiseksi.
Tästä johtuen itse suuri malli puuttuu tällä hetkellä, ja tutkijat yrittävät tarjota oppimiseen perustuvaa mallia esimerkiksi CoT:n kaltaisilla menetelmillä. Toisin kuin tehtävissä, jotka vaativat puhtaasti datapohjaista kuvantunnistusta ja selittämättömiä syitä, jokaisella ajavan henkilön teolla on selkeä liikkeellepaneva voima.
Sopivan algoritmiarkkitehtuurin suunnittelussa päätösradan tulisi muuttua muuttuvaksi ja optimoida tasaisesti tieteellisten tavoitteiden ohjauksessa sen sijaan, että pakotettaisiin ja säädettäisiin parametreja eri tapausten korjaamiseksi. Tällaisessa järjestelmässä ei luonnollisesti ole kaikenlaisia kovakoodattuja outoja sääntöjä.
Johtopäätös
Lyhyesti sanottuna päästä-päähän voi olla lupaava tekninen reitti, mutta konseptin soveltaminen vaatii enemmän tutkimusta. Mielestäni joukko tietoja ja malliparametreja ei ole ainoa oikea ratkaisu, ja jos haluamme ohittaa muut, meidän on jatkettava kovasti töitä.
Postitusaika: 24.4.2024