Kā definēt visaptverošu autonomas braukšanas sistēmu?
Visizplatītākā definīcija ir tāda, ka "no gala līdz galam" sistēma ir sistēma, kas ievada neapstrādātu sensora informāciju un tieši izvada mainīgos, kas attiecas uz uzdevumu. Piemēram, attēlu atpazīšanā CNN var saukt par "no gala līdz galam", salīdzinot ar tradicionālo funkciju + klasifikatora metodi.
Autonomās braukšanas uzdevumos tiek ievadīti dati no dažādiem sensoriem (piemēram, kamerām, LiDAR, radara vai IMU...), un transportlīdzekļa vadības signāli (piemēram, droseles vai stūres rata leņķis) tiek tieši izvadīti. Lai apsvērtu dažādu transportlīdzekļu modeļu pielāgošanās problēmas, izvadi var arī atvieglot transportlīdzekļa braukšanas trajektorijai.
Pamatojoties uz šo pamatu, ir radušās arī modulāras visaptverošas koncepcijas, piemēram, UniAD, kas uzlabo veiktspēju, papildus gala izvades vadības signāliem vai ceļa punktiem ieviešot attiecīgo starpuzdevumu uzraudzību. Tomēr no šādas šauras definīcijas gala līdz galam būtībai vajadzētu būt sensorās informācijas pārraidei bez zudumiem.
Vispirms apskatīsim saskarnes starp sensoru un PnC moduļiem ne-end-to-end sistēmās. Parasti mēs atklājam baltajā sarakstā iekļautos objektus (piemēram, automašīnas, cilvēkus utt.) un analizējam un prognozējam to īpašības. Mācāmies arī par statisko vidi (piemēram, ceļa uzbūvi, ātruma ierobežojumiem, luksoforiem u.c.). Ja mēs būtu detalizētāki, mēs atklātu arī universālus šķēršļus. Īsāk sakot, šo uztveri izvadītā informācija veido sarežģītu braukšanas ainu displeja modeli.
Tomēr dažām ļoti acīmredzamām ainām pašreizējā izteiktā abstrakcija nevar pilnībā aprakstīt faktorus, kas ietekmē braukšanas uzvedību ainā, vai arī uzdevumi, kas mums jādefinē, ir pārāk mazsvarīgi, un ir grūti uzskaitīt visus nepieciešamos uzdevumus. Tāpēc pilnīgas sistēmas nodrošina (varbūt netieši) visaptverošu attēlojumu ar cerību automātiski un bez zaudējumiem iedarboties uz PnC, izmantojot šo informāciju. Manuprāt, visas sistēmas, kas spēj izpildīt šo prasību, var saukt par vispārinātām end-to-end.
Attiecībā uz citām problēmām, piemēram, dažām dinamiskās mijiedarbības scenāriju optimizācijām, es uzskatu, ka vismaz šīs problēmas var atrisināt ne tikai no gala līdz galam, un tiešais risinājums var nebūt labākais risinājums. Tradicionālās metodes var atrisināt šīs problēmas, un, protams, ja datu apjoms ir pietiekami liels, labāks risinājums var būt no gala līdz galam.
Daži pārpratumi par autonomo braukšanu no gala līdz galam
1. Vadības signāliem un maršruta punktiem jābūt izvadītiem, lai tie būtu pilnībā.
Ja piekrītat iepriekš apspriestajam plašajam jēdzienam, tad šī problēma ir viegli saprotama. No gala līdz galam jāuzsver informācijas pārraide bez zudumiem, nevis tieša uzdevuma apjoma izvadīšana. Šaura visaptveroša pieeja radīs daudz nevajadzīgu problēmu un prasīs daudz slēptu risinājumu, lai nodrošinātu drošību.
2. Visaptverošai sistēmai jābūt balstītai uz lieliem modeļiem vai tīru redzējumu.
Nav vajadzīgās saiknes starp pilnīgu autonomo braukšanu, liela modeļa autonomo braukšanu un tīri vizuālu autonomo braukšanu, jo tie ir pilnīgi neatkarīgi jēdzieni; pilnīgu sistēmu ne vienmēr virza lieli modeļi, ne arī tīra vīzija. no.
3.Vai ilgtermiņā iepriekšminētajai end-to-end sistēmai šaurā nozīmē ir iespējams panākt autonomu braukšanu virs L3 līmeņa?
Tā, ko pašlaik sauc par tīru no gala līdz galam FSD, veiktspēja nebūt nav pietiekama, lai nodrošinātu uzticamību un stabilitāti, kas nepieciešama L3 līmenī. Atklātāk sakot, ja pašbraucošā sistēma vēlas, lai sabiedrība to pieņemtu, galvenais ir tas, vai sabiedrība var pieņemt, ka dažos gadījumos mašīna pieļaus kļūdas un cilvēki tās var viegli atrisināt. Tas ir grūtāk tīrai pilnīgai sistēmai.
Piemēram, gan Waymo, gan Cruise Ziemeļamerikā ir piedzīvojuši daudz negadījumu. Tomēr pēdējā Krūza avārijā tika gūti divi ievainojumi, lai gan šādi negadījumi ir diezgan neizbēgami un pieņemami cilvēku vadītājiem. Taču pēc šī negadījuma sistēma nepareizi novērtēja negadījuma vietu un ievainoto atrašanās vietu un pazemināja līdz pārvilkšanās režīmam, izraisot ievainoto vilkšanu ilgu laiku. Šāda rīcība nav pieņemama nevienam normālam autovadītājam. Tas netiks darīts, un rezultāti būs ļoti slikti.
Turklāt šis ir trauksmes zvans, ka mums rūpīgi jāapsver, kā izvairīties no šādas situācijas autonomās braukšanas sistēmu izstrādes un darbības laikā.
4. Kādi šobrīd ir praktiskie risinājumi nākamās paaudzes masveidā ražotām braukšanas palīgsistēmām?
Pēc manas pašreizējās izpratnes, braukšanā izmantojot tā saukto end-to-end modeli, pēc trajektorijas izvadīšanas tas atgriezīs uz tradicionālām metodēm balstītu risinājumu. Alternatīvi, uz mācībām balstīti plānotāji un tradicionālie trajektoriju plānošanas algoritmi vienlaikus izvada vairākas trajektorijas un pēc tam atlasa vienu trajektoriju, izmantojot selektoru.
Šāda veida slēptais risinājums un izvēle ierobežo šīs kaskādes sistēmas veiktspējas augšējo robežu, ja tiek pieņemta šī sistēmas arhitektūra. Ja šī metode joprojām ir balstīta uz tīru atgriezeniskās saites mācīšanos, notiks neparedzamas neveiksmes un mērķis būt drošam vispār netiks sasniegts.
Ja apsveram iespēju veikt atkārtotu optimizāciju vai atlasi, izmantojot tradicionālās plānošanas metodes šajā izvades trajektorijā, tas ir līdzvērtīgs trajektorijai, kas izveidota ar mācīšanās virzītu metodi; tāpēc kāpēc mēs tieši neoptimizējam un nemeklējam šo trajektoriju?
Protams, daži cilvēki teiktu, ka šāda optimizācijas vai meklēšanas problēma nav izliekta, tai ir liela stāvokļa telpa un to nav iespējams palaist reāllaikā transportlīdzekļa sistēmā. Es aicinu visus rūpīgi apsvērt šo jautājumu: pēdējo desmit gadu laikā uztveres sistēma ir saņēmusi vismaz simts reizes lielāku skaitļošanas jaudas dividendi, bet kā ir ar mūsu PnC moduli?
Ja mēs arī ļaujam PnC modulim izmantot lielu skaitļošanas jaudu, apvienojumā ar dažiem progresīvu optimizācijas algoritmu sasniegumiem pēdējos gados, vai šis secinājums joprojām ir pareizs? Šāda veida problēmas gadījumā mums vajadzētu apsvērt, kas ir pareizs no pirmajiem principiem.
5.Kā saskaņot attiecības starp datu vadītām un tradicionālajām metodēm?
Šaha spēlēšana ir piemērs, kas ļoti līdzīgs autonomai braukšanai. Šī gada februārī Deepmind publicēja rakstu ar nosaukumu "Grandmaster-Level Chess Without Search", kurā tika apspriests, vai ir iespējams AlphaGo un AlphaZero izmantot tikai uz datiem balstītu meklēšanu un atteikties no MCTS meklēšanas. Līdzīgi kā autonomā braukšanā, darbību tiešai izvadīšanai tiek izmantots tikai viens tīkls, savukārt visas turpmākās darbības tiek ignorētas.
Rakstā secināts, ka, neskatoties uz ievērojamo datu apjomu un modeļa parametriem, diezgan pamatotus rezultātus var iegūt, neizmantojot meklēšanu. Tomēr ir būtiskas atšķirības salīdzinājumā ar metodēm, kurās izmanto meklēšanu. Tas ir īpaši noderīgi, lai risinātu dažas sarežģītas beigu spēles.
Sarežģītos scenārijos vai stūra gadījumos, kad nepieciešamas daudzpakāpju spēles, šī līdzība joprojām apgrūtina pilnīgu atteikšanos no tradicionālajiem optimizācijas vai meklēšanas algoritmiem. Dažādu tehnoloģiju, piemēram, AlphaZero, priekšrocību saprātīga izmantošana ir labākais veids, kā uzlabot veiktspēju.
6. Tradicionālā metode = uz noteikumiem balstīta, ja citādi?
Man atkal un atkal ir nācies labot šo jēdzienu, runājot ar daudziem cilvēkiem. Daudzi cilvēki uzskata, ka tikmēr, kamēr tas nav balstīts tikai uz datiem, tas nav balstīts uz noteikumiem. Piemēram, šahā formulu un šaha ierakstu iegaumēšana pēc iegaumēšanas ir balstīta uz likumiem, taču, tāpat kā AlphaGo un AlphaZero, tas dod modelim iespēju būt racionālam, izmantojot optimizāciju un meklēšanu. Es nedomāju, ka to var saukt par balstītu uz noteikumiem.
Šī iemesla dēļ pašlaik trūkst paša lielā modeļa, un pētnieki cenšas nodrošināt uz mācībām balstītu modeli, izmantojot tādas metodes kā CoT. Tomēr atšķirībā no uzdevumiem, kuriem nepieciešama tikai ar datiem balstīta attēlu atpazīšana un neizskaidrojami iemesli, katrai vadītāja darbībai ir skaidrs virzītājspēks.
Saskaņā ar atbilstošu algoritma arhitektūras dizainu lēmumu trajektorijai jākļūst mainīgai un vienmērīgi optimizētai zinātnisku mērķu vadībā, nevis piespiedu kārtā lāpojot un koriģējot parametrus, lai labotu dažādus gadījumus. Šādai sistēmai, protams, nav visu veidu stingri iekodētu dīvainu noteikumu.
Secinājums
Īsāk sakot, no gala līdz galam var būt daudzsološs tehniskais ceļš, taču koncepcijas piemērošanai ir nepieciešams vairāk pētījumu. Es domāju, ka datu un modeļa parametru kopums nav vienīgais pareizais risinājums, un, ja vēlamies pārspēt citus, mums ir jāturpina smagi strādāt.
Izlikšanas laiks: 24.04.2024