Nola definitu muturreko gidatzeko sistema autonomoa?
Definizio ohikoena da "muturretik muturrerako" sistema sentsorearen informazio gordina sartzen duen sistema bat dela eta zuzenean zereginari dagozkion aldagaiak ateratzen dituena. Adibidez, irudien aitorpenean, CNN "end-to-end" deitu daiteke ezaugarri + sailkapen metodo tradizionalarekin alderatuta.
Gidatze autonomoko zereginetan, hainbat sentsoreren datuak (esaterako, kamerak, LiDAR, Radar edo IMU...) sartzen dira, eta ibilgailuen kontrol-seinaleak (hala nola gasolina edo bolantearen angelua) zuzenean ateratzen dira. Ibilgailu-eredu desberdinen egokitzapen-arazoak kontuan hartzeko, irteera ibilgailuaren gidatzeko ibilbidera ere lasaitu daiteke.
Oinarri horretatik abiatuta, muturreko kontzeptu modularrak ere sortu dira, hala nola UniAD, errendimendua hobetzen dutenak tarteko zeregin garrantzitsuak gainbegiratuz, azken irteerako kontrol-seinaleez edo bide-puntuez gain. Hala ere, hain definizio hertsi batetik, end-to-endaren funtsa zentzumen-informazioaren galerarik gabeko transmisioa izan beharko litzateke.
Berrikus ditzagun lehenik sentsazio eta PnC moduluen arteko interfazeak muturreko sistemetan. Normalean, zerrenda zuriko objektuak detektatzen ditugu (adibidez, autoak, pertsonak, etab.) eta haien propietateak aztertu eta aurreikusten ditugu. Ingurune estatikoa ere ikasten dugu (bideen egitura, abiadura mugak, semaforoak, etab.). Xeheagoak izango bagina, oztopo unibertsalak ere detektatuko genituzke. Laburbilduz, pertzepzio horiek ematen duten informazioa gidatzeko eszena konplexuen bistaratzeko eredua da.
Hala ere, oso ageriko eszenetarako, egungo abstrakzio esplizituak ezin ditu guztiz deskribatu eszenan gidatzeko portaeran eragiten duten faktoreak, edo zehaztu behar ditugun zereginak hutsuneegiak dira, eta zaila da beharrezkoak diren zeregin guztiak zenbatzea. Beraz, muturreko sistemak (agian inplizituki) irudikapen integrala eskaintzen dute, informazio horrekin automatikoki eta galerarik gabe PnC-etan jarduteko itxaropenarekin. Nire ustez, baldintza hori bete dezaketen sistema guztiei muturreko orokortu dei daiteke.
Beste gai batzuei dagokienez, hala nola, interakzio dinamikoko eszenatokien optimizazio batzuei dagokienez, uste dut, behintzat, amaiera-muturrekoak ez ezik arazo hauek konpondu ditzakeela, eta baliteke amaiera-muturrekoak ez direla irtenbiderik onena izango. Metodo tradizionalek arazo hauek ebatzi ditzakete, eta, jakina, datu-kopurua nahikoa handia denean, muturrak irtenbide hobea eman dezake.
Bukaerako gidatze autonomoari buruzko gaizki-ulertu batzuk
1. Kontrol-seinaleak eta bide-puntuak atera behar dira amaiera-muturrekoak izateko.
Goian aztertutako muturreko kontzeptu zabalarekin ados bazaude, arazo hau erraza da ulertzea. Mutur-muturrekoak informazioaren galerarik gabeko transmisioa azpimarratu behar du, ataza-bolumena zuzenean atera beharrean. Mutur-muturreko hurbilketa estuak alferrikako arazo asko eragingo ditu eta segurtasuna bermatzeko ezkutuko irtenbide asko beharko ditu.
2.Muturreko sistemak eredu handietan edo ikusmen hutsean oinarritu behar du.
Ez dago beharrezko loturarik amaierako gidatze autonomoaren, modelo handien gidatze autonomoaren eta ikusmenezko gidatze autonomo hutsaren artean kontzeptu guztiz independenteak direlako; muturreko sistema bat ez da zertan eredu handiek bultzatuta, ezta ikusmen hutsak bultzatuta ere. de.
3.Epe luzera, posible al da aipatutako muturreko sistema zentzu hertsian L3 mailatik gorako gidatze autonomoa lortzea?
Gaur egun end-to-end FSD hutsa deitzen denaren errendimendua nahikoa ez da L3 mailan eskatzen den fidagarritasuna eta egonkortasuna betetzeko. Argiago esateko, norberaren gidatzeko sistema publikoak onartu nahi badu, gakoa da publikoak onar dezakeen kasu batzuetan makinak akatsak egingo dituela, eta gizakiak erraz konpondu ditzakeela. Hau zailagoa da amaierako sistema huts baterako.
Esaterako, Ipar Amerikako Waymo zein Cruisek istripu asko izan dituzte. Hala ere, Cruiseren azken istripuak bi zauritu eragin zituen, nahiz eta horrelako istripuak nahiko saihestezinak eta onargarriak diren giza gidarientzat. Hala ere, istripu honen ondoren, sistemak oker baloratu zuen istripuaren kokalekua eta zaurituen kokapena eta pull-over modura jaitsi zen, zaurituak denbora luzez arrastatzea eraginez. Jokabide hori onartezina da edozein giza gidari arruntentzat. Ez da egingo, eta emaitzak oso txarrak izango dira.
Gainera, gidatzeko sistema autonomoen garapenean eta funtzionamenduan egoera hori nola saihestu behar den arreta handiz aztertu beharko genukeen deialdi bat da.
4.Beraz, momentu honetan, zeintzuk dira masiboki ekoitzitako gidatzeko sistemen hurrengo belaunaldirako irtenbide praktikoak?
Nire egungo ulermenaren arabera, gidatzeko amaierako eredua deritzona erabiltzean, ibilbidea atera ondoren, metodo tradizionaletan oinarritutako irtenbidea itzuliko du. Bestela, ikaskuntzan oinarritutako planifikatzaileek eta ibilbideen plangintza tradizionaleko algoritmoek ibilbide anitz ateratzen dituzte aldi berean eta, ondoren, hautatzaile baten bidez ibilbide bat hautatzen dute.
Ezkutuko irtenbide eta aukera honek kaskada-sistema honen errendimenduaren goiko muga mugatzen du sistema-arkitektura hau hartzen bada. Metodo hau oraindik feedback-ikaskuntza hutsean oinarritzen bada, ezusteko hutsegiteak gertatuko dira eta segurua izateko helburua ez da batere lortuko.
Irteera-ibilbide honetan plangintza-metodo tradizionalak erabiliz berriro optimizatzea edo hautatzea kontuan hartzen badugu, hau ikaskuntzak bultzatutako metodoak sortutako ibilbidearen baliokidea da; hortaz, zergatik ez dugu zuzenean optimizatu eta bilatu ibilbide hau?
Jakina, pertsona batzuek esango lukete optimizazio- edo bilaketa-arazo bat ez dela ganbila, egoera-espazio handia duela eta ezinezkoa dela ibilgailu barruko sistema batean denbora errealean exekutatu. Galdera hau arretaz aztertzeko eskatzen diet guztiei: azken hamar urteotan, pertzepzio-sistemak gutxienez ehun aldiz jaso du konputazio-potentziaren dibidendua, baina zer gertatzen da gure PnC modulua?
PnC moduluari konputazio-potentzia handia erabiltzeko aukera ematen badiogu, azken urteotan optimizazio-algoritmo aurreratuetan izandako aurrerapen batzuekin batera, ondorio hau zuzena al da oraindik? Mota honetako arazoetarako, lehen printzipioetatik zuzena dena kontuan hartu beharko genuke.
5.Nola uztartu datuetan oinarritutako metodoen eta metodo tradizionalen arteko erlazioa?
Xakean jokatzea gidatze autonomoaren oso antzekoa da. Aurtengo otsailean, Deepmind-ek "Grandmaster-Level Chess Without Search" izeneko artikulua argitaratu zuen, datuetan oinarritutako MCTS bilaketa AlphaGo eta AlphaZero-n soilik erabiltzea bideragarria den eztabaidatuz. Gidatze autonomoaren antzera, sare bakarra erabiltzen da zuzenean ekintzak ateratzeko, eta ondorengo urrats guztiak alde batera uzten diren bitartean.
Artikuluak ondorioztatzen du, datu eta eredu-parametro asko izan arren, emaitza nahiko arrazoizkoak lor daitezkeela bilaketarik erabili gabe. Hala ere, alde handiak daude bilaketa erabiltzen duten metodoekin alderatuta. Hau bereziki erabilgarria da amaierako joko konplexu batzuei aurre egiteko.
Urrats anitzeko jokoak behar dituzten agertoki konplexuetarako edo izkina-kasuetarako, analogia honek oraindik zaila egiten du optimizazio- edo bilaketa-algoritmo tradizionalak guztiz alde batera uztea. AlphaZero bezalako hainbat teknologiaren abantailak arrazoiz erabiltzea da errendimendua hobetzeko modurik onena.
6.Metodo tradizionala = arauetan oinarritutakoa bestela bada?
Kontzeptu hau behin eta berriz zuzendu behar izan dut jende askorekin hitz egiten ari nintzen bitartean. Jende askok uste du datuetan soilik gidatzen ez den bitartean, ez dela arauetan oinarritutakoa. Adibidez, xakean, formulak eta xake-erregistroak memorizatzea arauetan oinarritzen da, baina AlphaGo eta AlphaZeroren antzera, ereduari arrazionala izateko gaitasuna ematen dio optimizazioaren eta bilaketaren bidez. Ez dut uste arauetan oinarrituta dei daitekeenik.
Horregatik, eredu handia bera falta da gaur egun, eta ikertzaileak CoT bezalako metodoen bidez ikaskuntzan oinarritutako eredu bat eskaintzen saiatzen ari dira. Hala ere, datuetan oinarritutako irudien aitorpen hutsa eta arrazoi azalezinak behar dituzten zereginetan ez bezala, gidatzen duen pertsona baten ekintza bakoitzak indar eragile argia du.
Algoritmo-arkitektura-diseinu egokiaren arabera, erabakiaren ibilbidea aldakorra izan behar da eta helburu zientifikoen gidaritzapean uniformeki optimizatu behar da, kasu desberdinak konpontzeko parametroak indarrez adabaki eta doitzeko beharrean. Horrelako sistema batek, berez, ez ditu arau arraro gogor kodetuak.
Ondorioa
Laburbilduz, amaieratik amaierarako bide tekniko itxaropentsua izan daiteke, baina kontzeptua nola aplikatzen den ikerketa gehiago eskatzen du. Uste dut datu eta eredu parametro mordoa ez dela irtenbide zuzen bakarra, eta beste batzuk gainditu nahi baditugu, gogor lanean jarraitu behar dugu.
Argitalpenaren ordua: 2024-04-24