Kif tiddefinixxi sistema ta' sewqan awtonomu minn tarf sa tarf?
L-aktar definizzjoni komuni hija li sistema "tarf sa tarf" hija sistema li ddaħħal informazzjoni mhux ipproċessata tas-sensuri u toħroġ direttament varjabbli ta' tħassib għall-kompitu. Pereżempju, fir-rikonoxximent tal-immaġni, CNN jista 'jissejjaħ "tarf sa tarf" meta mqabbel mal-metodu tradizzjonali tal-karatteristika + klassifikatur.
F'ħidmiet ta 'sewqan awtonomu, id-dejta minn diversi sensuri (bħal kameras, LiDAR, Radar, jew IMU...) hija input, u sinjali ta' kontroll tal-vettura (bħal throttle jew angolu ta 'l-isteering) joħorġu direttament. Biex tikkunsidra l-kwistjonijiet ta 'adattament ta' mudelli ta 'vetturi differenti, l-output jista' wkoll jiġi rilassat għat-trajettorja tas-sewqan tal-vettura.
Ibbażat fuq din il-pedament, ħarġu wkoll kunċetti modulari minn tarf sa tarf, bħal UniAD, li jtejbu l-prestazzjoni billi jintroduċu superviżjoni ta 'kompiti intermedji rilevanti, minbarra s-sinjali finali tal-kontroll tal-output jew waypoints. Madankollu, minn definizzjoni dejqa bħal din, l-essenza ta 'tarf sa tarf għandha tkun it-trażmissjoni mingħajr telf ta' informazzjoni sensorja.
Ejja l-ewwel nirrevedu l-interfaces bejn moduli sensing u PnC f'sistemi mhux tarf sa tarf. Normalment, niskopru oġġetti fil-lista bajda (bħal karozzi, nies, eċċ.) u nanalizzaw u nbassru l-proprjetajiet tagħhom. Nitgħallmu wkoll dwar l-ambjent statiku (bħal struttura tat-triq, limiti tal-veloċità, dwal tat-traffiku, eċċ.). Kieku konna aktar dettaljati, insibu wkoll ostakli universali. Fil-qosor, l-output ta 'informazzjoni minn dawn il-perċezzjonijiet jikkostitwixxi mudell tal-wiri ta' xeni ta 'sewqan kumplessi.
Madankollu, għal xi xeni ovvji ħafna, l-astrazzjoni espliċita attwali ma tistax tiddeskrivi bis-sħiħ il-fatturi li jaffettwaw l-imġieba tas-sewqan fix-xena, jew il-kompiti li għandna bżonn niddefinixxu huma trivjali wisq, u huwa diffiċli li jiġu enumerati l-kompiti kollha meħtieġa. Għalhekk, sistemi tarf sa tarf jipprovdu rappreżentazzjoni komprensiva (forsi impliċitament) bit-tama li jaġixxu awtomatikament u mingħajr telf fuq PnCs b'din l-informazzjoni. Fl-opinjoni tiegħi, is-sistemi kollha li jistgħu jissodisfaw dan ir-rekwiżit jistgħu jissejħu ġeneralizzati minn tarf għal tarf.
Fir-rigward ta 'kwistjonijiet oħra, bħal xi ottimizzazzjonijiet ta' xenarji ta 'interazzjoni dinamika, nemmen li għall-inqas mhux biss tarf sa tarf jista' jsolvi dawn il-problemi, u tarf sa tarf jista 'ma jkunx l-aħjar soluzzjoni. Metodi tradizzjonali jistgħu jsolvu dawn il-problemi, u naturalment, meta l-ammont ta 'dejta jkun kbir biżżejjed, tarf sa tarf jista' jipprovdi soluzzjoni aħjar.
Xi nuqqas ta' ftehim dwar is-sewqan awtonomu minn tarf sa tarf
1. Is-sinjali tal-kontroll u l-waypoints għandhom jinħarġu biex ikunu minn tarf sa tarf.
Jekk taqbel mal-kunċett wiesa 'tarf sa tarf diskuss hawn fuq, allura din il-problema hija faċli biex tinftiehem. Tarf sa tarf għandu jenfasizza t-trażmissjoni mingħajr telf ta 'informazzjoni aktar milli joħroġ direttament il-volum tal-kompitu. Approċċ dejjaq minn tarf sa tarf se jikkawża ħafna problemi bla bżonn u jeħtieġ ħafna soluzzjonijiet moħbija biex tiġi żgurata s-sigurtà.
2.Is-sistema tarf sa tarf għandha tkun ibbażata fuq mudelli kbar jew viżjoni pura.
M'hemm l-ebda konnessjoni meħtieġa bejn sewqan awtonomu minn tarf sa tarf, sewqan awtonomu ta 'mudell kbir, u sewqan awtonomu purament viżwali minħabba li huma kunċetti kompletament indipendenti; sistema tarf sa tarf mhux bilfors hija mmexxija minn mudelli kbar, u lanqas ma hija neċessarjament immexxija minn viżjoni pura. ta.
3.Fil-medda t-twila, huwa possibbli li s-sistema minn tarf sa tarf imsemmija hawn fuq f'sens dejjaq tikseb sewqan awtonomu 'l fuq mil-livell L3?
Il-prestazzjoni ta' dak li bħalissa jissejjaħ FSD pur minn tarf sa tarf hija 'l bogħod milli tkun biżżejjed biex tilħaq l-affidabbiltà u l-istabbiltà meħtieġa fil-livell L3. Fi kliem aktar ċar, jekk is-sistema ta 'sewqan waħedha trid tiġi aċċettata mill-pubbliku, iċ-ċavetta hija jekk il-pubbliku jistax jaċċetta li f'xi każijiet, il-magna se tagħmel żbalji, u l-bnedmin jistgħu faċilment isolvuhom. Dan huwa aktar diffiċli għal sistema pura minn tarf sa tarf.
Pereżempju, kemm Waymo kif ukoll Cruise fl-Amerika ta’ Fuq kellhom ħafna inċidenti. Madankollu, l-aħħar inċident ta’ Cruise rriżulta f’żewġ ġrieħi, għalkemm inċidenti bħal dawn huma pjuttost inevitabbli u aċċettabbli għas-sewwieqa umani. Madankollu, wara dan l-inċident, is-sistema ġġudikat ħażin il-post tal-inċident u l-post tal-midruba u dgradat għall-modalità pull-over, u kkawża li l-midruba tiġi mkaxkra għal żmien twil. Din l-imġieba hija inaċċettabbli għal kull sewwieq uman normali. Mhux se jsir, u r-riżultati se jkunu ħżiena ħafna.
Barra minn hekk, din hija wake-up call li għandna nikkunsidraw bir-reqqa kif nevitaw din is-sitwazzjoni waqt l-iżvilupp u t-tħaddim ta’ sistemi ta’ sewqan awtonomu.
4.Allura f'dan il-mument, x'inhuma s-soluzzjonijiet prattiċi għall-ġenerazzjoni li jmiss ta 'sistemi ta' sewqan assistit prodotti bil-massa?
Skont il-fehim attwali tiegħi, meta tuża l-hekk imsejjaħ mudell tarf sa tarf fis-sewqan, wara li toħroġ it-trajettorja, se terġa 'lura soluzzjoni bbażata fuq metodi tradizzjonali. Alternattivament, pjanifikaturi bbażati fuq it-tagħlim u algoritmi tradizzjonali tal-ippjanar tat-trajettorja joħorġu trajettorji multipli simultanjament u mbagħad jagħżlu trajettorja waħda permezz ta 'selettur.
Dan it-tip ta 'soluzzjoni moħbija u għażla jillimita l-limitu ta' fuq tal-prestazzjoni ta 'din is-sistema kaskata jekk din l-arkitettura tas-sistema tiġi adottata. Jekk dan il-metodu għadu bbażat fuq tagħlim ta' feedback pur, se jseħħu fallimenti imprevedibbli u l-għan li jkun sigur ma jintlaħaq xejn.
Jekk nikkunsidraw l-ottimizzazzjoni mill-ġdid jew l-għażla bl-użu ta 'metodi ta' ppjanar tradizzjonali fuq din it-trajettorja tal-output, dan huwa ekwivalenti għat-trajettorja prodotta mill-metodu mmexxi mit-tagħlim; għalhekk, għaliex ma nottimizzawx u nfittxu direttament din it-trajettorja?
Naturalment, xi nies jgħidu li tali problema ta 'ottimizzazzjoni jew tfittxija mhix konvessa, għandha spazju kbir ta' stat, u hija impossibbli li taħdem f'ħin reali fuq sistema fil-vettura. Nappella lil kulħadd biex jikkunsidra bir-reqqa din il-mistoqsija: Fl-aħħar għaxar snin, is-sistema tal-perċezzjoni rċeviet mill-inqas mitt darba d-dividend tal-qawwa tal-kompjuter, imma xi ngħidu dwar il-modulu PnC tagħna?
Jekk inħallu wkoll lill-modulu PnC juża qawwa tal-kompjuters kbira, flimkien ma 'xi avvanzi f'algoritmi ta' ottimizzazzjoni avvanzati f'dawn l-aħħar snin, din il-konklużjoni għadha korretta? Għal din it-tip ta 'problema, għandna nikkunsidraw x'inhu korrett mill-ewwel prinċipji.
5.Kif tirrikonċilja r-relazzjoni bejn metodi mmexxija mid-data u tradizzjonali?
Il-logħob taċ-ċess huwa eżempju simili ħafna għal sewqan awtonomu. Fi Frar ta 'din is-sena, Deepmind ippubblikat artiklu msejjaħ "Grandmaster-Level Chess Without Search", jiddiskuti jekk huwiex fattibbli li tuża biss id-data mmexxija u tabbanduna t-tfittxija MCTS f'AlphaGo u AlphaZero. Simili għas-sewqan awtonomu, netwerk wieħed biss jintuża biex joħroġ direttament azzjonijiet, filwaqt li l-passi sussegwenti kollha jiġu injorati.
L-artikolu jikkonkludi li, minkejja ammonti konsiderevoli ta' dejta u parametri tal-mudell, jistgħu jinkisbu riżultati pjuttost raġonevoli mingħajr ma tintuża tfittxija. Madankollu, hemm differenzi sinifikanti meta mqabbla mal-metodi li jużaw it-tfittxija. Dan huwa speċjalment utli biex jittrattaw xi endgames kumplessi.
Għal xenarji kumplessi jew każijiet tal-kantunieri li jeħtieġu logħob f'diversi stadji, din l-analoġija xorta tagħmilha diffiċli biex tabbanduna kompletament l-ottimizzazzjoni tradizzjonali jew algoritmi ta 'tfittxija. L-użu raġonevoli tal-vantaġġi ta 'diversi teknoloġiji bħal AlphaZero huwa l-aħjar mod biex tittejjeb il-prestazzjoni.
6.Metodu tradizzjonali = ibbażat fuq ir-regoli jekk inkella?
Kelli nikkoreġi dan il-kunċett għal darb'oħra waqt li nitkellem ma' ħafna nies. Ħafna nies jemmnu li sakemm ma jkunx purament immexxi mid-dejta, mhuwiex ibbażat fuq ir-regoli. Pereżempju, fiċ-ċess, il-memorizzazzjoni tal-formuli u r-rekords taċ-ċess bir-rote hija bbażata fuq ir-regoli, iżda bħal AlphaGo u AlphaZero, tagħti lill-mudell il-kapaċità li jkun razzjonali permezz tal-ottimizzazzjoni u t-tfittxija. Ma naħsibx li tista' tissejjaħ ibbażata fuq ir-regoli.
Minħabba dan, il-mudell kbir innifsu bħalissa huwa nieqes, u r-riċerkaturi qed jippruvaw jipprovdu mudell immexxi mit-tagħlim permezz ta 'metodi bħal CoT. Madankollu, b'differenza mill-kompiti li jirrikjedu rikonoxximent ta' immaġini mmexxi minn dejta pura u raġunijiet li ma jistgħux jiġu spjegati, kull azzjoni ta 'persuna li qed issuq għandha forza ta' sewqan ċara.
Taħt id-disinn tal-arkitettura tal-algoritmu xieraq, it-trajettorja tad-deċiżjoni għandha ssir varjabbli u tkun ottimizzata b'mod uniformi taħt il-gwida ta 'għanijiet xjentifiċi, aktar milli tpattija u taġġusta b'mod sfurzat parametri biex jiffissaw każijiet differenti. Sistema bħal din naturalment m'għandhiex kull tip ta 'regoli strambi hard-coded.
Konklużjoni
Fil-qosor, tarf sa tarf jista 'jkun rotta teknika promettenti, iżda kif jiġi applikat il-kunċett jeħtieġ aktar riċerka. Naħseb mazz ta 'data u parametri tal-mudell mhix l-unika soluzzjoni korretta, u jekk irridu negħlbu lil oħrajn, irridu nibqgħu naħdmu ħafna.
Ħin tal-post: Apr-24-2024