Как да дефинираме система за автономно шофиране от край до край?
Най-често срещаната дефиниция е, че система "от край до край" е система, която въвежда необработена информация от сензора и директно извежда променливи, които са от значение за задачата. Например при разпознаването на изображения CNN може да се нарече „от край до край“ в сравнение с традиционния метод функция + класификатор.
При задачи за автономно шофиране данните от различни сензори (като камери, LiDAR, радар или IMU...) се въвеждат, а сигналите за управление на превозното средство (като газ или ъгъл на волана) се извеждат директно. За да се разгледат проблемите с адаптирането на различните модели превозни средства, изходът може също да бъде смекчен спрямо траекторията на движение на превозното средство.
Въз основа на тази основа също се появиха модулни концепции от край до край, като UniAD, които подобряват производителността чрез въвеждане на надзор на съответните междинни задачи, в допълнение към крайните изходни контролни сигнали или точки. Въпреки това, от такава тясна дефиниция, същността на край до край трябва да бъде предаването без загуби на сензорна информация.
Нека първо прегледаме интерфейсите между сензорни и PnC модули в системи, които не са от край до край. Обикновено откриваме обекти в белия списък (като коли, хора и т.н.) и анализираме и прогнозираме техните свойства. Научаваме и за статичната среда (като структура на пътя, ограничения на скоростта, светофари и т.н.). Ако бяхме по-подробни, щяхме да открием и универсални препятствия. Накратко, информацията, извеждана от тези възприятия, представлява модел на показване на сложни сцени на шофиране.
Въпреки това, за някои много очевидни сцени текущата изрична абстракция не може да опише напълно факторите, които влияят върху поведението на шофиране в сцената, или задачите, които трябва да дефинираме, са твърде тривиални и е трудно да се изброят всички необходими задачи. Следователно системите от край до край предоставят (може би имплицитно) изчерпателно представяне с надеждата автоматично и без загуби да действат върху PnC с тази информация. Според мен всички системи, които могат да отговорят на това изискване, могат да се нарекат обобщени от край до край.
Що се отнася до други въпроси, като например някои оптимизации на сценарии за динамично взаимодействие, вярвам, че поне не само от край до край може да реши тези проблеми, а от край до край може да не е най-доброто решение. Традиционните методи могат да решат тези проблеми и, разбира се, когато количеството данни е достатъчно голямо, от край до край може да осигури по-добро решение.
Някои недоразумения относно автономното шофиране от край до край
1. Контролните сигнали и точките трябва да се извеждат от край до край.
Ако сте съгласни с широката концепция от край до край, обсъдена по-горе, тогава този проблем е лесен за разбиране. От край до край трябва да се наблегне на предаването на информация без загуби, а не на директно извеждане на обема на задачата. Тесният подход от край до край ще причини много ненужни проблеми и ще изисква много скрити решения за осигуряване на безопасност.
2. Системата от край до край трябва да се основава на големи модели или чиста визия.
Няма необходима връзка между автономното шофиране от край до край, автономното шофиране на голям модел и чисто визуалното автономно шофиране, защото те са напълно независими концепции; една система от край до край не се управлява непременно от големи модели, нито непременно се управлява от чиста визия. на.
3. В дългосрочен план възможно ли е гореспоменатата система от край до край в тесен смисъл да постигне автономно шофиране над ниво L3?
Производителността на това, което в момента се нарича чист FSD от край до край, далеч не е достатъчна, за да отговори на надеждността и стабилността, изисквани на ниво L3. Казано по-направо, ако системата за самостоятелно управление иска да бъде приета от обществеността, ключът е дали обществеността може да приеме, че в някои случаи машината ще прави грешки и хората могат лесно да ги разрешат. Това е по-трудно за чиста система от край до край.
Например и Waymo, и Cruise в Северна Америка са имали много инциденти. Последният инцидент на Круз обаче доведе до двама наранявания, въпреки че подобни инциденти са доста неизбежни и приемливи за човешки шофьори. След този инцидент обаче системата не е преценила правилно мястото на инцидента и местоположението на ранените и е преминала към режим на спиране, което е накарало ранените да бъдат влачени дълго време. Това поведение е неприемливо за всеки нормален човешки шофьор. Няма да стане и резултатите ще са много лоши.
Освен това, това е сигнал за събуждане, че трябва внимателно да обмислим как да избегнем тази ситуация по време на разработването и експлоатацията на системи за автономно шофиране.
4. И така, в този момент какви са практическите решения за следващото поколение масово произвеждани системи за асистирано шофиране?
Според сегашното ми разбиране, когато се използва така нареченият модел от край до край при шофиране, след извеждане на траекторията, той ще върне решение, базирано на традиционни методи. Алтернативно, плановиците, базирани на обучение, и традиционните алгоритми за планиране на траектории извеждат множество траектории едновременно и след това избират една траектория чрез селектор.
Този вид скрито решение и избор ограничават горната граница на производителността на тази каскадна система, ако се приеме тази системна архитектура. Ако този метод все още се основава на чисто обучение с обратна връзка, ще възникнат непредсказуеми грешки и целта да бъдете безопасни изобщо няма да бъде постигната.
Ако обмислим повторно оптимизиране или избор с помощта на традиционни методи за планиране на тази изходна траектория, това е еквивалентно на траекторията, получена от метода, управляван от обучението; следователно, защо не оптимизираме директно и не търсим тази траектория?
Разбира се, някои хора биха казали, че такъв проблем с оптимизация или търсене не е изпъкнал, има голямо пространство на състоянието и е невъзможно да се изпълнява в реално време на система в автомобила. Умолявам всички да обмислят внимателно този въпрос: през последните десет години системата за възприемане е получила поне сто пъти дивидент от изчислителна мощност, но какво да кажем за нашия PnC модул?
Ако също така позволим на модула PnC да използва голяма изчислителна мощност, съчетано с известен напредък в усъвършенстваните алгоритми за оптимизация през последните години, това заключение все още ли е правилно? За този вид проблем трябва да обмислим кое е правилно от първите принципи.
5. Как да съвместим връзката между базираните на данни и традиционните методи?
Играта на шах е пример, много подобен на автономното шофиране. През февруари тази година Deepmind публикува статия, наречена „Шах на гросмайсторско ниво без търсене“, обсъждайки дали е възможно да се използва само управлявано от данни и да се изостави MCTS търсене в AlphaGo и AlphaZero. Подобно на автономното шофиране, само една мрежа се използва за директно извеждане на действия, докато всички следващи стъпки се игнорират.
Статията заключава, че въпреки значителните количества данни и параметри на модела, сравнително разумни резултати могат да бъдат получени без използване на търсене. Съществуват обаче значителни разлики в сравнение с методите, използващи търсене. Това е особено полезно за справяне с някои сложни крайни игри.
За сложни сценарии или ъглови случаи, които изискват многоетапни игри, тази аналогия все още затруднява пълното изоставяне на традиционната оптимизация или алгоритми за търсене. Разумното използване на предимствата на различни технологии като AlphaZero е най-добрият начин за подобряване на производителността.
6. Традиционен метод = базиран на правила, ако иначе?
Трябваше да коригирам тази концепция отново и отново, докато разговарях с много хора. Много хора вярват, че стига да не се управлява изцяло от данни, не е базиран на правила. Например в шаха запомнянето на формули и шахматни записи наизуст е базирано на правила, но подобно на AlphaGo и AlphaZero, то дава на модела способността да бъде рационален чрез оптимизиране и търсене. Не мисля, че може да се нарече базирано на правила.
Поради това самият голям модел в момента липсва и изследователите се опитват да осигурят модел, управляван от обучението, чрез методи като CoT. Въпреки това, за разлика от задачите, които изискват чисто управлявано от данни разпознаване на изображения и необясними причини, всяко действие на шофиращо лице има ясна движеща сила.
При подходящ дизайн на архитектурата на алгоритъма траекторията на вземане на решения трябва да стане променлива и да бъде равномерно оптимизирана под ръководството на научни цели, вместо насилствено коригиране и коригиране на параметри за коригиране на различни случаи. Такава система естествено няма всякакви твърдо кодирани странни правила.
Заключение
Накратко, от край до край може да е обещаващ технически път, но как се прилага концепцията изисква повече изследвания. Мисля, че куп данни и параметри на модела не е единственото правилно решение и ако искаме да надминем другите, трябва да продължим да работим усилено.
Време на публикуване: 24 април 2024 г