Системи за автономно возење од крај до крај: Возење во иднината

Автономно возење од крај до крај

Како да се дефинира систем за автономно возење од крај до крај?

Најчеста дефиниција е дека системот „од крај до крај“ е систем кој внесува необработени информации за сензорот и директно ги прикажува променливите што се интересни за задачата. На пример, во препознавањето слики, CNN може да се нарече „од крај до крај“ во споредба со традиционалниот метод на карактеристика + класификатор.

 

Во задачите за автономно возење, податоците од различни сензори (како камери, LiDAR, радар или IMU...) се внесуваат, а сигналите за контрола на возилото (како што е аголот на гасот или воланот) директно се емитуваат. За да се разгледаат проблемите со адаптацијата на различните модели на возила, излезот може да се релаксира и на траекторијата на возење на возилото.

 

Врз основа на оваа основа, исто така се појавија модуларни концепти од крај до крај, како што е UniAD, кои ги подобруваат перформансите со воведување надзор на релевантните средни задачи, покрај конечните излезни контролни сигнали или точки. Сепак, од толку тесна дефиниција, суштината на крај до крај треба да биде преносот на сетилните информации без загуби.

 

Дозволете ни прво да ги разгледаме интерфејсите помеѓу модулите за сензори и PnC во не-крај-до-крај системи. Обично, откриваме предмети на белата листа (како автомобили, луѓе итн.) и ги анализираме и предвидуваме нивните својства. Учиме и за статичната средина (како што е структурата на патот, ограничувањата на брзината, семафорите итн.). Да бевме подетални, ќе детектиравме и универзални пречки. Накратко, излезните информации од овие перцепции претставуваат модел на приказ на сложени сцени за возење.

 

Меѓутоа, за некои многу очигледни сцени, сегашната експлицитна апстракција не може целосно да ги опише факторите кои влијаат на однесувањето при возење на сцената или задачите што треба да ги дефинираме се премногу тривијални и тешко е да се набројат сите потребни задачи. Затоа, системите од крај до крај обезбедуваат (можеби имплицитно) сеопфатно претставување со надеж за автоматско и без загуби дејствување на PnC со овие информации. Според мое мислење, сите системи кои можат да го исполнат ова барање може да се наречат генерализирани од крај до крај.

 

Што се однесува до другите прашања, како што се некои оптимизации на сценарија за динамична интеракција, верувам дека барем не само од крај до крај може да ги реши овие проблеми, а од крај до крај можеби не е најдоброто решение. Традиционалните методи можат да ги решат овие проблеми, и се разбира, кога количината на податоци е доволно голема, од крај до крај може да обезбеди подобро решение.

Некои недоразбирања за автономното возење од крај до крај

1. Контролните сигнали и точките мора да бидат излезни за да бидат од крај до крај.

Ако се согласувате со широкиот концепт од крај до крај дискутиран погоре, тогаш овој проблем е лесно да се разбере. Од крај до крај треба да го нагласи преносот на информации без загуби, наместо директно да го емитува обемот на задачата. Тесниот пристап од крај до крај ќе предизвика многу непотребни проблеми и ќе бара многу тајни решенија за да се обезбеди безбедност.

2. Системот од крај до крај мора да се базира на големи модели или чиста визија.

Не постои неопходна врска помеѓу автономното возење од крај до крај, автономното возење на големиот модел и чисто визуелното автономно возење бидејќи тие се целосно независни концепти; системот од крај до крај не е нужно управуван од големи модели, ниту пак е нужно управуван од чиста визија. на.

Систем за истражување и развој на автономно возење од крај до крај

3. На долг рок, дали е можно гореспоменатиот систем од крај до крај во потесна смисла да постигне автономно возење над нивото L3?

 

Перформансите на она што моментално се нарекува чисто FSD од крај до крај е далеку од доволно за да се задоволат доверливоста и стабилноста потребни на нивото L3. Поточно кажано, ако системот за самоуправување сака да биде прифатен од јавноста, клучот е дали јавноста може да прифати дека во некои случаи, машината ќе прави грешки, а луѓето лесно можат да ги решат. Ова е потешко за чист систем од крај до крај.

 

На пример, и Waymo и Cruise во Северна Америка имале многу несреќи. Сепак, последната несреќа на Круз резултираше со двајца повредени, иако таквите несреќи се прилично неизбежни и прифатливи за човечките возачи. Меѓутоа, по оваа несреќа, системот погрешно ја процени локацијата на несреќата и локацијата на повредениот и го спушти во режим на повлекување, поради што повредените беа влечени подолго време. Ова однесување е неприфатливо за секој нормален човечки возач. Тоа нема да се направи, а резултатите ќе бидат многу лоши.

 

Понатаму, ова е повик за будење дека треба внимателно да размислиме како да ја избегнеме оваа ситуација при развојот и функционирањето на системи за автономно возење.

4. Значи, во овој момент, кои се практичните решенија за следната генерација на масовно произведени системи за асистирано возење?

 

Според моето сегашно разбирање, при користење на таканаречениот модел од крај до крај во возењето, по излегувањето на траекторијата, тој ќе врати решение засновано на традиционални методи. Алтернативно, планерите базирани на учење и традиционалните алгоритми за планирање на траектории даваат повеќе траектории истовремено и потоа избираат една траекторија преку избирачот.

 

Ваквото прикриено решение и избор ја ограничува горната граница на перформансите на овој каскаден систем доколку се усвои оваа системска архитектура. Ако овој метод сè уште се заснова на чисто учење со повратни информации, ќе се случат непредвидливи неуспеси и целта да се биде безбеден нема воопшто да се постигне.

 

Ако размислиме за повторно оптимизирање или избирање со користење на традиционалните методи на планирање на оваа излезна траекторија, тоа е еквивалентно на траекторијата произведена од методот управуван од учење; затоа, зошто директно не ја оптимизираме и пребаруваме оваа траекторија?

 

Се разбира, некои луѓе би рекле дека таков проблем за оптимизација или пребарување е неконвексен, има голем простор на состојбата и е невозможно да се работи во реално време на систем во возилото. Ги молам сите внимателно да го разгледаат ова прашање: во изминатите десет години, системот за перцепција доби најмалку сто пати поголема дивиденда од компјутерската моќ, но што е со нашиот PnC модул?

 

Ако му дозволиме и на PnC модулот да користи голема компјутерска моќ, во комбинација со одреден напредок во напредните алгоритми за оптимизација во последниве години, дали овој заклучок сè уште е точен? За ваков проблем, треба да размислиме што е точно од првите принципи.

5.Како да се усогласи односот помеѓу методите управувани од податоци и традиционалните методи?

 

Играњето шах е пример многу сличен на автономното возење. Во февруари оваа година, Deepmind објави статија наречена „Шах без пребарување на ниво на велемајстори“, во која се дискутира дали е изводливо да се користи само податоци управувано и да се откаже од пребарувањето MCTS во AlphaGo и AlphaZero. Слично на автономното возење, само една мрежа се користи за директно давање дејства, додека сите следни чекори се игнорираат.

 

Написот заклучува дека, и покрај значителните количини на податоци и параметри на моделот, може да се добијат прилично разумни резултати без користење на пребарување. Сепак, постојат значителни разлики во споредба со методите кои користат пребарување. Ова е особено корисно за справување со некои сложени крајни игри.

 

За сложени сценарија или аголни случаи кои бараат игри со повеќе чекори, оваа аналогија сè уште го отежнува целосното напуштање на традиционалната оптимизација или алгоритми за пребарување. Разумното искористување на предностите на различни технологии како AlphaZero е најдобриот начин за подобрување на перформансите.

Контрола на возилото

6.Традиционален метод = заснован на правила ако друго?

 

Морав да го поправам овој концепт одново и одново додека разговарав со многу луѓе. Многу луѓе веруваат дека сè додека не се базира чисто на податоци, не се заснова на правила. На пример, во шахот, меморирањето на формули и шаховски записи напамет се заснова на правила, но како и AlphaGo и AlphaZero, тоа му дава на моделот способност да биде рационален преку оптимизација и пребарување. Мислам дека тоа не може да се нарече засновано на правила.

 

Поради ова, самиот голем модел моментално недостасува, а истражувачите се обидуваат да обезбедат модел управуван од учење преку методи како што е CoT. Меѓутоа, за разлика од задачите кои бараат чисто препознавање на слики водени од податоци и необјасниви причини, секоја акција на лице кое вози има јасна движечка сила.

 

Според соодветниот дизајн на архитектурата на алгоритам, траекторијата на одлучување треба да стане променлива и да биде подеднакво оптимизирана под водство на научни цели, наместо насилно да се закрпат и прилагодуваат параметрите за да се поправат различни случаи. Таков систем природно нема секакви тврдокодирани чудни правила.

Заклучок

Накратко, од крај до крај може да биде ветувачка техничка рута, но како се применува концептот бара повеќе истражување. Мислам дека еден куп податоци и параметри на моделот не се единственото правилно решение и ако сакаме да ги надминеме другите, мора да продолжиме да работиме напорно.


Време на објавување: Април-24-2024