Како дефинисати систем аутономне вожње од краја до краја?
Најчешћа дефиниција је да је систем „од краја до краја“ систем који уноси необрађене информације сензора и директно емитује варијабле од значаја за задатак. На пример, у препознавању слика, ЦНН се може назвати "од краја до краја" у поређењу са традиционалном методом карактеристика + класификатор.
У задацима аутономне вожње, подаци са различитих сензора (као што су камере, ЛиДАР, Радар или ИМУ...) се уносе, а сигнали управљања возилом (као што су гас или угао волана) се директно излазе. Да би се размотрили проблеми прилагођавања различитих модела возила, излаз се такође може смањити на путању вожње возила.
На основу ове основе, такође су се појавили модуларни концепти од краја до краја, као што је УниАД, који побољшавају перформансе увођењем надзора над релевантним међузадацима, поред коначних излазних контролних сигнала или тачака пута. Међутим, из тако уске дефиниције, суштина од краја до краја би требало да буде пренос сензорних информација без губитака.
Хајде да прво прегледамо интерфејсе између сензорских и ПнЦ модула у системима који нису од краја до краја. Обично откривамо објекте са беле листе (као што су аутомобили, људи итд.) и анализирамо и предвиђамо њихова својства. Такође учимо о статичком окружењу (као што су структура пута, ограничења брзине, семафори, итд.). Да смо детаљнији, детектовали бисмо и универзалне препреке. Укратко, информације које излазе из ових перцепција чине модел приказа сложених сцена вожње.
Међутим, за неке веома очигледне сцене, тренутна експлицитна апстракција не може у потпуности да опише факторе који утичу на понашање у вожњи у сцени, или су задаци које треба да дефинишемо превише тривијални, па је тешко набројати све потребне задатке. Стога, системи од краја до краја пружају (можда имплицитно) свеобухватну репрезентацију са надом да ће аутоматски и без губитака деловати на ПнЦ-ове са овим информацијама. По мом мишљењу, сви системи који могу да испуне овај захтев могу се назвати генерализованим енд-то-енд.
Што се тиче других питања, као што су неке оптимизације сценарија динамичке интеракције, верујем да барем не само енд-то-енд може решити ове проблеме, а енд-то-енд можда није најбоље решење. Традиционалне методе могу да реше ове проблеме, и наравно, када је количина података довољно велика, енд-то-енд може пружити боље решење.
Неки неспоразуми о аутономној вожњи од краја до краја
1. Контролни сигнали и путне тачке морају се емитовати да би били од краја до краја.
Ако се слажете са широким концептом од краја до краја који је горе размотрен, онда је овај проблем лако разумети. Од краја до краја треба да се нагласи пренос информација без губитака, а не директан излаз обима задатка. Уски приступ од краја до краја ће изазвати много непотребних проблема и захтевати много прикривених решења како би се осигурала безбедност.
2. Систем од краја до краја мора бити заснован на великим моделима или чистој визији.
Не постоји неопходна веза између аутономне вожње од краја до краја, аутономне вожње великих модела и чисто визуелне аутономне вожње јер су то потпуно независни концепти; систем од краја до краја није нужно вођен великим моделима, нити је нужно вођен чистом визијом. оф.
3. Дугорочно гледано, да ли је могуће да горе поменути енд-то-енд систем у ужем смислу постигне аутономну вожњу изнад нивоа Л3?
Перформансе онога што се тренутно назива чисти енд-то-енд ФСД далеко су од довољне да задовоље поузданост и стабилност потребне на нивоу Л3. Да будемо отвореније, ако систем самовожње жели да буде прихваћен од стране јавности, кључно је да ли јавност може да прихвати да ће у неким случајевима машина правити грешке, а људи их лако могу решити. Ово је теже за чист систем од краја до краја.
На пример, и Ваимо и Цруисе у Северној Америци су имали много несрећа. Међутим, последња Цруисеова несрећа је резултирала са две повреде, иако су такве незгоде прилично неизбежне и прихватљиве за људске возаче. Међутим, након ове несреће, систем је погрешно проценио локацију несреће и локацију повређених и прешао у режим повлачења, због чега су повређени дуго били вучени. Ово понашање је неприхватљиво за било ког нормалног људског возача. То неће бити урађено, а резултати ће бити веома лоши.
Штавише, ово је позив за буђење да треба пажљиво размотрити како да избегнемо ову ситуацију током развоја и рада система аутономне вожње.
4. Дакле, у овом тренутку, која су практична решења за следећу генерацију масовно произведених система за помоћ у вожњи?
Према мом тренутном схватању, када се користи такозвани енд-то-енд модел у вожњи, након излаза путање, вратиће решење засновано на традиционалним методама. Алтернативно, планери засновани на учењу и традиционални алгоритми за планирање путање дају више путања истовремено, а затим бирају једну путању кроз селектор.
Ова врста прикривеног решења и избора ограничава горњу границу перформанси овог каскадног система ако се усвоји ова архитектура система. Ако се овај метод и даље заснива на чистом повратном учењу, доћи ће до непредвидивих неуспеха, а циљ да будете безбедни уопште неће бити постигнут.
Ако размотримо поновну оптимизацију или одабир коришћењем традиционалних метода планирања на овој излазној путањи, ово је еквивалентно путањи произведеној методом вођеном учењем; стога, зашто не бисмо директно оптимизовали и претражили ову путању?
Наравно, неки људи би рекли да такав проблем оптимизације или претраге није конвексан, да има велики простор стања и да је немогуће покренути у реалном времену на систему у возилу. Молим све да пажљиво размотре ово питање: У протеклих десет година, систем перцепције је добио најмање сто пута већу дивиденду рачунарске снаге, али шта је са нашим ПнЦ модулом?
Ако такође дозволимо ПнЦ модулу да користи велику рачунарску снагу, у комбинацији са неким напретком у напредним алгоритмима оптимизације последњих година, да ли је овај закључак још увек тачан? За ову врсту проблема, требало би да размотримо шта је исправно од првих принципа.
5. Како помирити однос између метода заснованих на подацима и традиционалних метода?
Играње шаха је пример веома сличан аутономној вожњи. У фебруару ове године, Деепминд је објавио чланак под називом „Шах на нивоу велемајстора без претраге“, расправљајући о томе да ли је изводљиво користити само вођену подацима и напустити МЦТС претрагу у АлпхаГо и АлпхаЗеро. Слично аутономној вожњи, само једна мрежа се користи за директан излаз акција, док се сви наредни кораци занемарују.
У чланку се закључује да се, упркос значајним количинама података и параметара модела, могу добити прилично разумни резултати без коришћења претраге. Међутим, постоје значајне разлике у поређењу са методама које користе претрагу. Ово је посебно корисно за решавање неких сложених завршних игара.
За сложене сценарије или углове који захтевају игре у више корака, ова аналогија и даље отежава потпуно напуштање традиционалних алгоритама оптимизације или претраживања. Разумно коришћење предности различитих технологија као што је АлпхаЗеро је најбољи начин за побољшање перформанси.
6.Традиционална метода = заснована на правилима ако је другачије?
Морао сам да исправљам овај концепт изнова и изнова док сам разговарао са многим људима. Многи људи верују да све док није искључиво заснован на подацима, није заснован на правилима. На пример, у шаху, памћење формула и шаховских записа напамет је засновано на правилима, али попут АлпхаГо и АлпхаЗеро, даје моделу могућност да буде рационалан кроз оптимизацију и претрагу. Мислим да се то не може назвати заснованим на правилима.
Због тога, сам велики модел тренутно недостаје, а истраживачи покушавају да обезбеде модел заснован на учењу помоћу метода као што је ЦоТ. Међутим, за разлику од задатака који захтевају чисто препознавање слике на основу података и необјашњиве разлоге, свака радња особе која вози има јасну покретачку снагу.
У складу са одговарајућим дизајном архитектуре алгоритама, путања одлуке треба да постане променљива и да буде уједначено оптимизована под вођством научних циљева, уместо насилног крпљења и прилагођавања параметара да би се поправили различити случајеви. Такав систем природно нема све врсте тврдо кодираних чудних правила.
Закључак
Укратко, од краја до краја може бити технички пут који обећава, али начин на који се концепт примењује захтева више истраживања. Мислим да гомила података и параметара модела није једино исправно решење, а ако желимо да надмашимо друге, морамо да наставимо вредно да радимо.
Време поста: 24. април 2024