Sut i ddiffinio system yrru ymreolaethol o un pen i'r llall?
Y diffiniad mwyaf cyffredin yw bod system "o'r dechrau i'r diwedd" yn system sy'n mewnbynnu gwybodaeth synhwyrydd amrwd ac yn allbynnu'n uniongyrchol newidynnau sy'n peri pryder i'r dasg. Er enghraifft, wrth adnabod delweddau, gellir galw CNN yn "ddiwedd-i-ddiwedd" o'i gymharu â'r nodwedd draddodiadol + dull dosbarthwr.
Mewn tasgau gyrru ymreolaethol, mae data o wahanol synwyryddion (fel camerâu, LiDAR, Radar, neu IMU ...) yn cael eu mewnbynnu, ac mae signalau rheoli cerbydau (fel llindag neu ongl olwyn llywio) yn allbwn uniongyrchol. Er mwyn ystyried materion addasu gwahanol fodelau cerbydau, gellir llacio'r allbwn hefyd i lwybr gyrru'r cerbyd.
Yn seiliedig ar y sylfaen hon, mae cysyniadau modiwlaidd diwedd-i-ddiwedd hefyd wedi dod i'r amlwg, megis UniAD, sy'n gwella perfformiad trwy gyflwyno goruchwyliaeth o dasgau canolradd perthnasol, yn ychwanegol at y signalau rheoli allbwn terfynol neu'r cyfeirbwyntiau. Fodd bynnag, o ddiffiniad mor gyfyng, trosglwyddo gwybodaeth synhwyraidd yn ddi-golled ddylai fod yn hanfodol o'r dechrau i'r diwedd.
Yn gyntaf, gadewch inni adolygu'r rhyngwynebau rhwng synhwyro a modiwlau PnC mewn systemau nad ydynt yn rhai pen-i-ben. Fel arfer, rydym yn canfod gwrthrychau ar y rhestr wen (fel ceir, pobl, ac ati) ac yn dadansoddi a rhagfynegi eu priodweddau. Rydym hefyd yn dysgu am yr amgylchedd sefydlog (fel strwythur ffyrdd, cyfyngiadau cyflymder, goleuadau traffig, ac ati). Pe baem yn fwy manwl, byddem hefyd yn canfod rhwystrau cyffredinol. Yn fyr, mae allbwn gwybodaeth y canfyddiadau hyn yn fodel arddangos o olygfeydd gyrru cymhleth.
Fodd bynnag, ar gyfer rhai golygfeydd amlwg iawn, ni all y haniaethiad amlwg cyfredol ddisgrifio'n llawn y ffactorau sy'n effeithio ar ymddygiad gyrru yn yr olygfa, neu mae'r tasgau y mae angen i ni eu diffinio yn rhy ddibwys, ac mae'n anodd rhifo'r holl dasgau gofynnol. Felly, mae systemau pen-i-ben yn darparu cynrychiolaeth gynhwysfawr (efallai yn ymhlyg) gyda'r gobaith o weithredu'n awtomatig ac yn ddi-golled ar PnCs gyda'r wybodaeth hon. Yn fy marn i, gellir galw pob system sy'n gallu bodloni'r gofyniad hwn yn gyffredinol o un pen i'r llall.
Fel ar gyfer materion eraill, megis rhai optimizations o senarios rhyngweithio deinamig, credaf y gall o leiaf nid yn unig o un pen i'r llall ddatrys y problemau hyn, ac efallai nad diwedd-i-ddiwedd yw'r ateb gorau. Gall dulliau traddodiadol ddatrys y problemau hyn, ac wrth gwrs, pan fo'r swm o ddata yn ddigon mawr, efallai y bydd o'r dechrau i'r diwedd yn darparu ateb gwell.
Rhai camddealltwriaeth ynghylch gyrru ymreolaethol o'r dechrau i'r diwedd
1. Rhaid i signalau rheoli a chyfeirbwyntiau fod yn allbwn o un pen i'r llall.
Os ydych chi'n cytuno â'r cysyniad eang o un pen i'r llall a drafodwyd uchod, yna mae'r broblem hon yn hawdd ei deall. Dylai o'r dechrau i'r diwedd bwysleisio trosglwyddo gwybodaeth yn ddi-golled yn hytrach nag allbynnu maint y dasg yn uniongyrchol. Bydd ymagwedd gul o'r dechrau i'r diwedd yn achosi llawer o drafferth diangen ac yn gofyn am lawer o atebion cudd i sicrhau diogelwch.
2. Rhaid i'r system o'r dechrau i'r diwedd fod yn seiliedig ar fodelau mawr neu weledigaeth pur.
Nid oes unrhyw gysylltiad angenrheidiol rhwng gyrru ymreolaethol o un pen i'r llall, gyrru ymreolaethol model mawr, a gyrru ymreolaethol gweledol yn unig oherwydd eu bod yn gysyniadau cwbl annibynnol; nid yw system o un pen i'r llall o reidrwydd yn cael ei llywio gan fodelau mawr, ac nid yw ychwaith o reidrwydd yn cael ei llywio gan weledigaeth bur. o.
3.Yn y tymor hir, a yw'n bosibl i'r system pen-i-ben a grybwyllir uchod mewn ystyr cul gyflawni gyrru ymreolaethol uwchlaw lefel L3?
Mae perfformiad yr hyn a elwir ar hyn o bryd yn FSD pen-i-ben pur ymhell o fod yn ddigon i fodloni'r dibynadwyedd a'r sefydlogrwydd sy'n ofynnol ar lefel L3. I'w roi yn fwy di-flewyn ar dafod, os yw'r system hunan-yrru am gael ei derbyn gan y cyhoedd, yr allwedd yw a all y cyhoedd dderbyn y bydd y peiriant yn gwneud camgymeriadau mewn rhai achosion, a gall bodau dynol eu datrys yn hawdd. Mae hyn yn anoddach i system bur o un pen i'r llall.
Er enghraifft, mae Waymo a Cruise yng Ngogledd America wedi cael llawer o ddamweiniau. Fodd bynnag, arweiniodd damwain olaf Cruise at ddau anaf, er bod damweiniau o'r fath yn weddol anochel ac yn dderbyniol i yrwyr dynol. Fodd bynnag, ar ôl y ddamwain hon, camfarnodd y system leoliad y ddamwain a lleoliad yr anafedig a'i israddio i'r modd tynnu drosodd, gan achosi i'r anafedig gael ei lusgo am amser hir. Mae'r ymddygiad hwn yn annerbyniol i unrhyw yrrwr dynol arferol. Ni fydd yn cael ei wneud, a bydd y canlyniadau'n ddrwg iawn.
At hynny, mae hwn yn alwad deffro y dylem ystyried yn ofalus sut i osgoi'r sefyllfa hon yn ystod datblygiad a gweithrediad systemau gyrru ymreolaethol.
4. Felly ar hyn o bryd, beth yw'r atebion ymarferol ar gyfer y genhedlaeth nesaf o systemau gyrru â chymorth màs-gynhyrchu?
Yn ôl fy nealltwriaeth gyfredol, wrth ddefnyddio'r model diwedd-i-ben fel y'i gelwir wrth yrru, ar ôl allbynnu'r llwybr, bydd yn dychwelyd datrysiad yn seiliedig ar ddulliau traddodiadol. Fel arall, mae cynllunwyr seiliedig ar ddysgu ac algorithmau cynllunio taflwybr traddodiadol yn allbynnu taflwybrau lluosog ar yr un pryd ac yna'n dewis un taflwybr trwy ddetholwr.
Mae'r math hwn o ddatrysiad a dewis cudd yn cyfyngu ar derfyn uchaf perfformiad y system raeadru hon os mabwysiadir y bensaernïaeth system hon. Os yw'r dull hwn yn dal i fod yn seiliedig ar ddysgu adborth pur, bydd methiannau anrhagweladwy yn digwydd ac ni fydd y nod o fod yn ddiogel yn cael ei gyflawni o gwbl.
Os byddwn yn ystyried ail-optimeiddio neu ddewis gan ddefnyddio dulliau cynllunio traddodiadol ar y taflwybr allbwn hwn, mae hyn yn cyfateb i'r taflwybr a gynhyrchir gan y dull a yrrir gan ddysgu; felly, pam na wnawn ni optimeiddio a chwilio'r llwybr hwn yn uniongyrchol?
Wrth gwrs, byddai rhai pobl yn dweud nad yw problem optimeiddio neu chwilio o'r fath yn amgrwm, mae ganddi le cyflwr mawr, ac mae'n amhosibl ei rhedeg mewn amser real ar system mewn cerbyd. Rwy’n erfyn ar bawb i ystyried y cwestiwn hwn yn ofalus: Yn ystod y deng mlynedd diwethaf, mae’r system ganfyddiad wedi derbyn o leiaf ganwaith y difidend pŵer cyfrifiadurol, ond beth am ein modiwl PnC?
Os byddwn hefyd yn caniatáu i'r modiwl PnC ddefnyddio pŵer cyfrifiadurol mawr, ynghyd â rhai datblygiadau mewn algorithmau optimeiddio uwch yn y blynyddoedd diwethaf, a yw'r casgliad hwn yn dal yn gywir? Ar gyfer y math hwn o broblem, dylem ystyried yr hyn sy'n gywir o'r egwyddorion cyntaf.
5.How i gysoni'r berthynas rhwng dulliau a yrrir gan ddata a dulliau traddodiadol?
Mae chwarae gwyddbwyll yn enghraifft debyg iawn i yrru ymreolaethol. Ym mis Chwefror eleni, cyhoeddodd Deepmind erthygl o'r enw "Grandmaster-Level Chess Without Search", yn trafod a yw'n ymarferol defnyddio chwiliad MCTS sy'n cael ei yrru gan ddata yn unig yn AlphaGo ac AlphaZero. Yn debyg i yrru ymreolaethol, dim ond un rhwydwaith a ddefnyddir i allbynnu gweithredoedd yn uniongyrchol, tra bod yr holl gamau dilynol yn cael eu hanwybyddu.
Daw'r erthygl i'r casgliad, er gwaethaf cryn dipyn o ddata a pharamedrau model, y gellir cael canlyniadau gweddol resymol heb ddefnyddio chwiliad. Fodd bynnag, mae gwahaniaethau sylweddol o gymharu â dulliau sy'n defnyddio chwilio. Mae hyn yn arbennig o ddefnyddiol ar gyfer delio â rhai diwedd gemau cymhleth.
Ar gyfer senarios cymhleth neu achosion cornel sy'n gofyn am gemau aml-gam, mae'r gyfatebiaeth hon yn dal i'w gwneud hi'n anodd rhoi'r gorau i optimeiddio traddodiadol neu algorithmau chwilio yn llwyr. Defnyddio manteision technolegau amrywiol fel AlphaZero yn rhesymol yw'r ffordd orau o wella perfformiad.
6.Dull traddodiadol = seiliedig ar reolau os arall?
Rwyf wedi gorfod cywiro'r cysyniad hwn dro ar ôl tro wrth siarad â llawer o bobl. Mae llawer o bobl yn credu, cyn belled nad yw'n cael ei yrru gan ddata yn unig, nad yw'n seiliedig ar reolau. Er enghraifft, mewn gwyddbwyll, mae cofio fformiwlâu a chofnodion gwyddbwyll ar y cof yn seiliedig ar reolau, ond fel AlphaGo ac AlphaZero, mae'n rhoi'r gallu i'r model fod yn rhesymegol trwy optimeiddio a chwilio. Nid wyf yn meddwl y gellir ei alw'n seiliedig ar reolau.
Oherwydd hyn, mae’r model mawr ei hun ar goll ar hyn o bryd, ac mae ymchwilwyr yn ceisio darparu model sy’n cael ei yrru gan ddysgu trwy ddulliau megis CoT. Fodd bynnag, yn wahanol i dasgau sy'n gofyn am adnabyddiaeth delwedd pur a yrrir gan ddata a rhesymau anesboniadwy, mae gan bob gweithred gan berson sy'n gyrru rym gyrru clir.
O dan y dyluniad pensaernïaeth algorithm priodol, dylai'r llwybr penderfyniad ddod yn amrywiol a chael ei optimeiddio'n unffurf o dan arweiniad nodau gwyddonol, yn hytrach na chlytio ac addasu paramedrau yn rymus i drwsio gwahanol achosion. Yn naturiol, nid oes gan system o'r fath bob math o reolau rhyfedd cod caled.
Casgliad
Yn fyr, gall un pen i'r llall fod yn llwybr technegol addawol, ond mae angen mwy o ymchwil i gymhwyso'r cysyniad. Rwy'n credu nad criw o baramedrau data a model yw'r unig ateb cywir, ac os ydym am ragori ar eraill, mae'n rhaid i ni barhau i weithio'n galed.
Amser post: Ebrill-24-2024