Hvernig á að skilgreina sjálfstætt aksturskerfi frá enda til enda?
Algengasta skilgreiningin er sú að „enda-til-enda“ kerfi er kerfi sem setur inn hráar skynjaraupplýsingar og gefur beint út breytur sem hafa áhyggjur af verkefninu. Til dæmis, í myndgreiningu, er hægt að kalla CNN „end-to-end“ samanborið við hefðbundna eiginleika + flokkunaraðferðina.
Í sjálfvirkum akstursverkefnum eru gögn frá ýmsum skynjurum (eins og myndavélum, LiDAR, Radar eða IMU...) tekin inn og stýrimerki ökutækis (eins og inngjöf eða horn stýrishjóls) eru send beint út. Til að íhuga aðlögunarvandamál mismunandi gerða ökutækja er einnig hægt að slaka á afköstum við akstursferil ökutækisins.
Byggt á þessum grunni hafa einnig komið fram einingahugtök frá enda til enda, eins og UniAD, sem bæta frammistöðu með því að innleiða eftirlit með viðeigandi milliverkefnum, auk lokaúttaksstýringarmerkja eða leiðarpunkta. Hins vegar, út frá svo þröngri skilgreiningu, ætti kjarninn í enda til enda að vera taplaus sending skynupplýsinga.
Leyfðu okkur fyrst að endurskoða viðmótin milli skynjunar og PnC eininga í kerfum sem ekki eru frá enda til enda. Venjulega greinum við hluti á hvítlista (eins og bíla, fólk o.s.frv.) og greinum og spáum fyrir um eiginleika þeirra. Við lærum líka um kyrrstæða umhverfið (svo sem vegagerð, hraðatakmarkanir, umferðarljós o.s.frv.). Ef við værum ítarlegri myndum við líka greina alhliða hindranir. Í stuttu máli má segja að upplýsingarnar frá þessum skynjun eru sýnislíkan af flóknum akstursenum.
Hins vegar, í sumum mjög augljósum senum, getur núverandi skýra útdráttur ekki lýst fullkomlega þeim þáttum sem hafa áhrif á aksturshegðun á vettvangi, eða verkefnin sem við þurfum að skilgreina eru of léttvæg og erfitt er að telja upp öll nauðsynleg verkefni. Þess vegna veita enda-til-enda kerfi (kannski óbeint) yfirgripsmikla framsetningu með von um að vinna sjálfkrafa og taplaust á PnCs með þessum upplýsingum. Að mínu mati má kalla öll kerfi sem geta uppfyllt þessa kröfu alhæft enda til enda.
Hvað önnur mál varðar, eins og nokkrar hagræðingar á kraftmiklum samspilssviðsmyndum, þá tel ég að að minnsta kosti ekki aðeins end-to-end geti leyst þessi vandamál, og end-to-end gæti ekki verið besta lausnin. Hefðbundnar aðferðir geta leyst þessi vandamál og auðvitað, þegar gagnamagnið er nógu mikið, getur end-to-end verið betri lausn.
Einhver misskilningur varðandi sjálfvirkan akstur frá enda til enda
1. Stjórnmerki og leiðarpunktar verða að vera gefnir út til að vera frá enda til enda.
Ef þú ert sammála víðtæku hugtakinu frá enda til enda sem fjallað er um hér að ofan, þá er þetta vandamál auðvelt að skilja. Enda til enda ætti að leggja áherslu á tapslausa sendingu upplýsinga frekar en að gefa beint út magn verksins. Þröng nálgun frá enda til enda mun valda miklum óþarfa vandræðum og krefjast mikilla leynilegra lausna til að tryggja öryggi.
2.Enda-til-enda kerfið verður að byggjast á stórum gerðum eða hreinni sýn.
Það eru engin nauðsynleg tengsl á milli sjálfvirks aksturs frá enda til enda, sjálfstýrður aksturs af stórum gerðum og hreins sjónræns sjálfsaksturs vegna þess að þau eru algjörlega sjálfstæð hugtök; enda-til-enda kerfi er ekki endilega knúið áfram af stórum gerðum, né er það endilega knúið áfram af hreinni sýn. af.
3.Til lengri tíma litið, er mögulegt fyrir ofangreint end-to-end kerfi í þröngum skilningi að ná sjálfvirkum akstri yfir L3 stigi?
Frammistaða þess sem nú er kallað hreint end-to-end FSD er langt frá því að vera nægjanlegt til að mæta þeim áreiðanleika og stöðugleika sem krafist er á L3 stigi. Skemmst er frá því að segja að ef sjálfkeyrandi kerfið vill vera samþykkt af almenningi er lykilatriðið hvort almenningur geti sætt sig við að í sumum tilfellum muni vélin gera mistök og menn geta auðveldlega leyst þau. Þetta er erfiðara fyrir hreint end-to-end kerfi.
Til dæmis hafa bæði Waymo og Cruise í Norður-Ameríku lent í mörgum slysum. Síðasta slys Cruise olli hins vegar tveimur meiðslum, þó slík slys séu nokkuð óumflýjanleg og ásættanleg fyrir ökumenn manna. Eftir þetta slys fór kerfið hins vegar rangt með staðsetningu slyssins og staðsetningu slasaðra og færði niður í dráttarstillingu, sem olli því að slasaðir drógust í langan tíma. Þessi hegðun er óásættanleg öllum venjulegum ökumönnum. Það verður ekki gert og árangurinn verður mjög slæmur.
Ennfremur er þetta vakning um að við ættum að íhuga vandlega hvernig við getum forðast þetta ástand við þróun og rekstur sjálfstýrðra aksturskerfa.
4.Svo á þessari stundu, hverjar eru hagnýtar lausnir fyrir næstu kynslóð fjöldaframleiddra aðstoðaraksturskerfa?
Samkvæmt núverandi skilningi mínum mun það skila lausn sem byggir á hefðbundnum aðferðum þegar notað er svokallað end-to-end módel í akstri, eftir að brautin hefur verið sett út. Að öðrum kosti gefa námstengdir skipuleggjendur og hefðbundin reiknirit fyrir áætlunarferil út margar brautir samtímis og velja síðan eina braut í gegnum veljara.
Svona leynileg lausn og val takmarkar efri mörk frammistöðu þessa kerfiskerfis ef þessi kerfisarkitektúr er tekin upp. Ef þessi aðferð byggir enn á hreinu endurgjöfarnámi munu ófyrirsjáanlegar bilanir eiga sér stað og markmiðið um að vera öruggt næst alls ekki.
Ef við íhugum að endurstilla eða velja með hefðbundnum áætlunaraðferðum á þessari framleiðsluferil, jafngildir það ferlinu sem framleidd er með námsdrifnu aðferðinni; þess vegna, hvers vegna fínstillum við ekki beint og leitum þessa braut?
Auðvitað myndu sumir segja að slíkt hagræðingar- eða leitarvandamál sé ekki kúpt, hafi mikið ástandsrými og ómögulegt að keyra það í rauntíma á kerfi í ökutæki. Ég bið alla um að íhuga þessa spurningu vandlega: Undanfarin tíu ár hefur skynjunarkerfið fengið að minnsta kosti hundraðfaldan arð af tölvuafli, en hvað með PnC eininguna okkar?
Ef við leyfum líka PnC einingunni að nota mikið tölvuafl, ásamt nokkrum framförum í háþróuðum hagræðingaralgrímum á undanförnum árum, er þessi niðurstaða enn rétt? Fyrir svona vandamál ættum við að íhuga hvað er rétt frá fyrstu meginreglum.
5.Hvernig á að samræma samband gagnadrifna og hefðbundinna aðferða?
Að tefla er mjög svipað dæmi og sjálfstætt akstur. Í febrúar á þessu ári birti Deepmind grein sem nefnist „Grandmaster-Level Chess Without Search“ þar sem fjallað er um hvort það sé framkvæmanlegt að nota eingöngu gagnadrifna og hætta við MCTS leit í AlphaGo og AlphaZero. Líkt og sjálfvirkur akstur er aðeins eitt net notað til að senda beint út aðgerðir, en öll síðari skref eru hunsuð.
Greinin kemst að þeirri niðurstöðu að þrátt fyrir töluvert magn af gögnum og líkanbreytum sé hægt að fá nokkuð sanngjarnar niðurstöður án þess að nota leit. Hins vegar er marktækur munur miðað við aðferðir sem nota leit. Þetta er sérstaklega gagnlegt til að takast á við flókna endaleiki.
Fyrir flóknar aðstæður eða horntilvik sem krefjast fjölþrepa leikja, gerir þessi samlíking það samt erfitt að hætta algjörlega við hefðbundna hagræðingu eða leitarreiknirit. Að nýta kosti ýmissa tækni eins og AlphaZero er besta leiðin til að bæta árangur.
6.Hefðbundin aðferð = reglubundin ef annað?
Ég hef þurft að leiðrétta þetta hugtak aftur og aftur á meðan ég talaði við marga. Margir telja að svo framarlega sem það sé ekki eingöngu gagnadrifið sé það ekki byggt á reglum. Til dæmis, í skák, er það að leggja á minnið formúlur og skákskrár eftir reglu byggt á reglu, en eins og AlphaGo og AlphaZero gefur það líkaninu möguleika á að vera skynsamlegt með hagræðingu og leit. Ég held að það sé ekki hægt að kalla það reglubundið.
Vegna þessa vantar stóra líkanið sjálft eins og er og vísindamenn reyna að útvega námsdrifið líkan með aðferðum eins og CoT. Hins vegar, ólíkt verkefnum sem krefjast hreinnar gagnastýrðrar myndgreiningar og óútskýranlegra ástæðna, hefur hver aðgerð ökumanns skýran drifkraft.
Samkvæmt viðeigandi arkitektúrhönnun reikniritsins ætti ákvörðunarferillinn að verða breytilegur og vera einsleitur fínstilltur undir leiðsögn vísindalegra markmiða, frekar en að nauðbeygja og stilla færibreytur til að laga mismunandi tilvik. Slíkt kerfi hefur náttúrulega ekki alls kyns harðkóðaðar undarlegar reglur.
Niðurstaða
Í stuttu máli getur end-to-end verið vænleg tæknileg leið, en hvernig hugmyndinni er beitt krefst frekari rannsókna. Ég held að fullt af gögnum og líkanabreytum sé ekki eina rétta lausnin og ef við viljum fara fram úr öðrum verðum við að halda áfram að vinna hörðum höndum.
Pósttími: 24. apríl 2024