Siostaman dràibhidh fèin-riaghailteach deireadh-gu-deireadh: Driving the Future

Dràibheadh ​​​​fèin-riaghlaidh deireadh-gu-deireadh

Mar a mhìnicheas tu siostam dràibhidh fèin-riaghailteach deireadh-gu-deireadh?

Is e am mìneachadh as cumanta gur e siostam “ceann-gu-deireadh” siostam a tha a’ toirt a-steach fiosrachadh mothachaidh amh agus a’ toirt a-mach caochladairean a tha a’ dèanamh dragh don obair gu dìreach. Mar eisimpleir, ann an aithneachadh ìomhaighean, faodar CNN a bhith air ainmeachadh mar “deireadh-gu-deireadh” an taca ris an fheart traidiseanta + modh seòrsachaidh.

 

Ann an gnìomhan dràibhidh fèin-riaghailteach, tha dàta bho dhiofar luchd-mothachaidh (leithid camarathan, LiDAR, Radar, no IMU ...) air an toirt a-steach, agus tha comharran smachd carbaid (leithid smeòrach no ceàrn cuibhle stiùiridh) air an toirt a-mach gu dìreach. Gus beachdachadh air cùisean atharrachaidh diofar mhodalan carbaid, faodar an toradh a shocrachadh cuideachd gu slighe dràibhidh a’ charbaid.

 

Stèidhichte air a’ bhunait seo, tha bun-bheachdan modular deireadh-gu-deireadh air nochdadh cuideachd, leithid UniAD, a leasaicheas coileanadh le bhith a’ toirt a-steach stiùireadh air gnìomhan eadar-mheadhanach buntainneach, a bharrachd air na comharran smachd toraidh deireannach no slighean-slighe. Ach, bho mhìneachadh cho cumhang, bu chòir gur e brìgh deireadh-gu-deireadh a bhith a’ toirt seachad fiosrachadh mothachaidh gun chall.

 

Leig leinn an-toiseach ath-sgrùdadh a dhèanamh air an eadar-aghaidh eadar modalan mothachaidh agus PnC ann an siostaman neo-cheann-gu-deireadh. Mar as trice, bidh sinn a’ lorg nithean air an liosta gheal (leithid càraichean, daoine, msaa) agus a’ sgrùdadh agus a’ ro-innse na feartan aca. Bidh sinn cuideachd ag ionnsachadh mun àrainneachd statach (leithid structar rathaid, crìochan astair, solais trafaic, msaa). Nam biodh sinn nas mionaidiche, lorgadh sinn cnapan-starra uile-choitcheann cuideachd. Ann an ùine ghoirid, tha an toradh fiosrachaidh leis na beachdan sin mar mhodail taisbeanaidh de sheallaidhean dràibhidh iom-fhillte.

 

Ach, airson cuid de sheallaidhean a tha gu math follaiseach, chan urrainn don tarraing soilleir gnàthach cunntas iomlan a thoirt air na feartan a tha a’ toirt buaidh air giùlan dràibhidh san t-sealladh, no tha na gnìomhan a dh’ fheumas sinn a mhìneachadh ro bheag, agus tha e duilich a h-uile gnìomh a tha a dhìth àireamhachadh. Mar sin, tha siostaman deireadh-gu-deireadh a’ toirt seachad riochdachadh coileanta (is dòcha gu h-obann) leis an dòchas a bhith ag obair gu fèin-ghluasadach agus gun chall air PnCn leis an fhiosrachadh seo. Nam bheachd-sa, faodar a h-uile siostam a choinnicheas ris an riatanas seo a ghairm coitcheann deireadh-gu-deireadh.

 

A thaobh cùisean eile, leithid cuid de optimizations de shuidheachaidhean eadar-obrachaidh fiùghantach, tha mi a’ creidsinn nach e a-mhàin deireadh-gu-deireadh na duilgheadasan sin fhuasgladh, agus is dòcha nach e deireadh-gu-deireadh am fuasgladh as fheàrr. Faodaidh dòighean traidiseanta na duilgheadasan sin fhuasgladh, agus gu dearbh, nuair a tha an ìre de dhàta mòr gu leòr, faodaidh deireadh gu deireadh fuasgladh nas fheàrr a thoirt seachad.

Cuid de mhì-thuigse mu dhràibheadh ​​​​fèin-riaghlaidh deireadh-gu-deireadh

1. Feumaidh comharran smachd agus puingean slighe a bhith air an cur a-mach gus a bhith ceann-gu-deireadh.

Ma tha thu ag aontachadh leis a’ bhun-bheachd fharsaing deireadh-gu-deireadh a chaidh a dheasbad gu h-àrd, tha an duilgheadas seo furasta a thuigsinn. Bu chòir ceann-gu-deireadh cuideam a chuir air sgaoileadh fiosrachaidh gun chall seach a bhith a’ toirt a-mach meud na h-obrach gu dìreach. Bidh dòigh-obrach cumhang deireadh-gu-deireadh ag adhbhrachadh tòrr trioblaid neo-riatanach agus bidh feum air tòrr fhuasglaidhean falaichte gus dèanamh cinnteach à sàbhailteachd.

2. Feumaidh an siostam deireadh-gu-deireadh a bhith stèidhichte air modalan mòra no sealladh fìor.

Chan eil ceangal riatanach eadar dràibheadh ​​​​fèin-riaghlaidh deireadh-gu-deireadh, dràibheadh ​​​​fèin-riaghlaidh mòr-mhodail, agus dràibheadh ​​​​fèin-riaghlaidh dìreach lèirsinneach seach gu bheil iad nam bun-bheachdan gu tur neo-eisimeileach; chan eil siostam ceann-gu-deireadh gu riatanach air a stiùireadh le modalan mòra, agus chan eil e riatanach air a stiùireadh le lèirsinn fhìor. à.

Siostam sgrùdaidh is leasachaidh dràibhidh fèin-riaghailteach deireadh-gu-deireadh

3. Anns an fhad-ùine, a bheil e comasach don t-siostam deireadh-gu-deireadh gu h-àrd ann an seagh cumhang dràibheadh ​​​​fèin-riaghlaidh a choileanadh os cionn ìre L3?

 

Tha coileanadh an rud ris an canar an-dràsta FSD fìor cheann-gu-deireadh fada bho bhith gu leòr gus coinneachadh ris an earbsachd agus an seasmhachd a tha riatanach aig ìre L3. Gus a chuir nas soilleire, ma tha an siostam fèin-dràibhidh ag iarraidh gum bi am poball air gabhail ris, is e an rud as cudromaiche an urrainn don phoball gabhail ris gun dèan an inneal mearachdan ann an cuid de chùisean, agus gun urrainn dha daoine am fuasgladh gu furasta. Tha seo nas duilghe airson siostam fìor-ghlan deireadh-gu-deireadh.

 

Mar eisimpleir, tha an dà chuid Waymo agus Cruise ann an Ameireaga a Tuath air mòran thubaistean fhaighinn. Ach, dh'adhbhraich an tubaist mu dheireadh aig Cruise dà leòn, ged a tha tubaistean mar sin gu math do-sheachanta agus iomchaidh dha draibhearan daonna. Ach, às deidh an tubaist seo, rinn an siostam droch bhreithneachadh air suidheachadh an tubaist agus suidheachadh an fheadhainn a chaidh a ghoirteachadh agus air an lughdachadh gu modh tarraing-thairis, ag adhbhrachadh gun deach an leòn a shlaodadh airson ùine mhòr. Tha an giùlan seo mì-fhreagarrach do dhràibhear daonna àbhaisteach sam bith. Cha tèid a dhèanamh, agus bidh na toraidhean gu math dona.

 

A bharrachd air an sin, is e gairm dùisg a tha seo gum bu chòir dhuinn beachdachadh gu faiceallach air mar as urrainn dhuinn an suidheachadh seo a sheachnadh rè leasachadh agus obrachadh siostaman dràibhidh fèin-riaghailteach.

4.Mar sin aig an àm seo, dè na fuasglaidhean practaigeach airson an ath ghinealach de shiostaman dràibhidh le taic mòr-thoradh?

 

A rèir na tuigse a th’ agam an-dràsta, nuair a bhios mi a’ cleachdadh a’ mhodail deireadh-gu-deireadh ris an canar ann an dràibheadh, às deidh dha an t-slighe a chuir a-mach, tillidh e fuasgladh stèidhichte air dòighean traidiseanta. Air an làimh eile, bidh luchd-dealbhaidh stèidhichte air ionnsachadh agus algoirmean dealbhaidh slighe traidiseanta a’ toirt a-mach iomadh slighe aig an aon àm agus an uairsin a’ taghadh aon slighe tro roghnaichear.

 

Tha an seòrsa fuasgladh agus roghainn falaichte seo a’ cuingealachadh crìoch àrd coileanadh an t-siostam cascade seo ma thèid gabhail ris an ailtireachd siostam seo. Ma tha an dòigh seo fhathast stèidhichte air fìor ionnsachadh fios air ais, thig fàilligidhean nach gabh a thuigsinn agus cha tèid an amas a bhith sàbhailte a choileanadh idir.

 

Ma bheachdaicheas sinn air ath-optimachadh no taghadh a’ cleachdadh dhòighean dealbhaidh traidiseanta air an t-slighe toraidh seo, tha seo co-ionann ris an t-slighe a chaidh a thoirt a-mach leis an dòigh ionnsachaidh; mar sin, carson nach dèan sinn an fheum as fheàrr agus an sgrùdadh air an t-slighe seo?

 

Gu dearbh, bhiodh cuid de dhaoine ag ràdh gu bheil an leithid de dhuilgheadas optimization no sgrùdaidh neo-convex, gu bheil àite stàite mòr aige, agus gu bheil e do-dhèanta ruith ann an àm fìor air siostam in-carbaid. Tha mi a’ guidhe air a h-uile duine beachdachadh gu faiceallach air a’ cheist seo: Anns na deich bliadhna a dh’ fhalbh, tha an siostam beachd air co-dhiù ceud uair na cuibhreann cumhachd coimpiutaireachd fhaighinn, ach dè mu dheidhinn ar modal PnC?

 

Ma leigeas sinn cuideachd leis a’ mhodal PnC cumhachd coimpiutaireachd mòr a chleachdadh, còmhla ri beagan adhartais ann an algorithms optimization adhartach anns na bliadhnachan mu dheireadh, a bheil an co-dhùnadh seo fhathast ceart? Airson an seòrsa duilgheadas seo, bu chòir dhuinn beachdachadh air dè a tha ceart bhon chiad phrionnsapalan.

5.How gus an dàimh eadar dòighean-obrach stèidhichte air dàta agus dòighean traidiseanta a rèiteachadh?

 

Tha cluich tàileasg na eisimpleir glè choltach ri dràibheadh ​​​​fèin-riaghlaidh. Anns a’ Ghearran am-bliadhna, dh’ fhoillsich Deepmind artaigil leis an t-ainm “Grandmaster-level Chess Without Search”, a’ beachdachadh air a bheil e do-dhèanta a bhith a’ cleachdadh ach rannsachadh MCTS air a stiùireadh le dàta agus a thrèigsinn ann an AlphaGo agus AlphaZero. Coltach ri draibheadh ​​​​fèin-riaghailteach, chan eil ach aon lìonra air a chleachdadh gus gnìomhan a chuir a-mach gu dìreach, fhad ‘s a thathas a’ seachnadh a h-uile ceum às deidh sin.

 

Tha an artaigil a 'co-dhùnadh, a dh' aindeoin mòran dàta agus crìochan modail, gum faighear toraidhean cothromach reusanta gun a bhith a 'cleachdadh rannsachadh. Ach, tha eadar-dhealachaidhean mòra ann an coimeas ri dòighean sgrùdaidh. Tha seo gu sònraichte feumail airson dèiligeadh ri cuid de endgames iom-fhillte.

 

Airson suidheachaidhean iom-fhillte no cùisean oisean a dh ’fheumas geamannan ioma-cheum, tha an samhlachas seo fhathast ga dhèanamh duilich a bhith a’ trèigsinn algorithms optimization no sgrùdaidh traidiseanta gu tur. Is e cleachdadh reusanta buannachdan diofar theicneòlasan leithid AlphaZero an dòigh as fheàrr air coileanadh a leasachadh.

Smachd Carbaid

6.Traditional method = riaghailt-stèidhichte ma tha eile?

 

B’ fheudar dhomh am bun-bheachd seo a cheartachadh a-rithist agus a-rithist fhad ‘s a bha mi a’ bruidhinn ri mòran dhaoine. Tha mòran den bheachd, cho fad 's nach eil e dìreach air a stiùireadh le dàta, nach eil e stèidhichte air riaghailtean. Mar eisimpleir, ann an tàileasg, tha a bhith a’ cuimhneachadh fhoirmlean agus clàran tàileasg le cuimhne stèidhichte air riaghailtean, ach mar AlphaGo agus AlphaZero, tha e a’ toirt comas don mhodail a bhith reusanta tro optimization agus sgrùdadh. Chan eil mi a’ smaoineachadh gum faodar a ghairm stèidhichte air riaghailt.

 

Air sgàth seo, tha am modail mòr fhèin a dhìth an-dràsta, agus tha luchd-rannsachaidh a’ feuchainn ri modal ionnsachaidh a thoirt seachad tro dhòighean leithid CoT. Ach, eu-coltach ri gnìomhan a dh’ fheumas aithneachadh ìomhaigh fìor-ghlan stèidhichte air dàta agus adhbharan nach gabh mìneachadh, tha feachd dràibhidh soilleir aig a h-uile gnìomh neach a tha a’ draibheadh.

 

Fo dhealbhadh ailtireachd algorithm iomchaidh, bu chòir an t-slighe co-dhùnaidh a bhith caochlaideach agus a bhith air a bharrrachadh gu co-ionnan fo stiùireadh amasan saidheansail, seach a bhith gu làidir a’ gleusadh agus ag atharrachadh pharamadairean gus diofar chùisean a chàradh. Chan eil siostam leithid seo gu nàdarrach a 'toirt a h-uile seòrsa de riaghailtean neònach le còd cruaidh.

Co-dhùnadh

Ann an ùine ghoirid, faodaidh deireadh-gu-deireadh a bhith na shlighe theicnigeach gealltanach, ach mar a tha am bun-bheachd air a chuir an sàs feumar barrachd rannsachaidh. Tha mi a’ smaoineachadh nach e dòrlach de pharaimearan dàta is mhodail an aon fhuasgladh ceart, agus ma tha sinn airson a dhol thairis air feadhainn eile, feumaidh sinn cumail ag obair gu cruaidh.


Ùine puist: Giblean-24-2024