Як визначити наскрізну систему автономного водіння?
Найпоширенішим визначенням є те, що «наскрізна» система — це система, яка вводить необроблену інформацію датчиків і безпосередньо виводить змінні, що стосуються завдання. Наприклад, у розпізнаванні зображень CNN можна назвати «наскрізним» порівняно з традиційним методом ознака + класифікатор.
У задачах автономного водіння вводяться дані з різних датчиків (таких як камери, LiDAR, радар або IMU...), а сигнали керування транспортним засобом (такі як дросельна заслінка чи кут повороту керма) виводяться безпосередньо. Щоб розглянути проблеми адаптації різних моделей транспортних засобів, вихідні дані також можна послабити відповідно до траєкторії руху автомобіля.
На основі цього фундаменту також з’явилися модульні наскрізні концепції, такі як UniAD, які покращують продуктивність шляхом введення контролю за відповідними проміжними завданнями на додаток до кінцевих вихідних керуючих сигналів або шляхових точок. Однак, з такого вузького визначення, суть наскрізного має полягати в передачі сенсорної інформації без втрат.
Давайте спочатку розглянемо інтерфейси між сенсорними модулями та модулями PnC у нескрізних системах. Зазвичай ми виявляємо об’єкти з білого списку (наприклад, автомобілі, люди тощо), аналізуємо та прогнозуємо їхні властивості. Ми також дізнаємося про статичне оточення (таке як дорожня структура, обмеження швидкості, світлофори тощо). Якби ми були більш детальними, ми б також виявили універсальні перешкоди. Коротше кажучи, інформація, отримана цим сприйняттям, являє собою модель відображення складних сцен водіння.
Однак для деяких дуже очевидних сцен поточна явна абстракція не може повністю описати фактори, які впливають на поведінку водія в сцені, або завдання, які нам потрібно визначити, є надто тривіальними, і важко перерахувати всі необхідні завдання. Таким чином, наскрізні системи забезпечують (можливо, неявно) вичерпне представлення з надією автоматично та без втрат діяти на PnC з цією інформацією. На мій погляд, усі системи, які можуть відповідати цій вимозі, можна назвати узагальненими наскрізними.
Що стосується інших питань, таких як деякі оптимізації сценаріїв динамічної взаємодії, я вважаю, що принаймні не тільки наскрізне може вирішити ці проблеми, і наскрізне може бути не найкращим рішенням. Традиційні методи можуть вирішити ці проблеми, і, звичайно, коли обсяг даних досить великий, наскрізне може забезпечити краще рішення.
Деякі непорозуміння щодо наскрізного автономного водіння
1. Контрольні сигнали та шляхові точки повинні бути наскрізними.
Якщо ви згодні з широкою наскрізною концепцією, розглянутою вище, то цю проблему легко зрозуміти. Наскрізна передача інформації повинна наголошуватися на передачі інформації без втрат, а не на прямому виведенні обсягу завдання. Вузький наскрізний підхід спричинить багато непотрібних проблем і вимагатиме багатьох прихованих рішень для забезпечення безпеки.
2. Наскрізна система має базуватися на великих моделях або чистому баченні.
Немає необхідного зв’язку між наскрізним автономним водінням, автономним водінням великої моделі та суто візуальним автономним водінням, оскільки це абсолютно незалежні концепції; наскрізна система не обов’язково керується великими моделями, а також не обов’язково керується чистим баченням. з.
3. У довгостроковій перспективі чи можлива вищезгадана наскрізна система у вузькому сенсі для досягнення автономного водіння вище рівня L3?
Продуктивність того, що зараз називається чистим наскрізним FSD, далеко недостатня для забезпечення надійності та стабільності, необхідних на рівні L3. Відверто кажучи, якщо система самостійного керування хоче бути прийнятою суспільством, ключовим моментом є те, чи зможе громадськість погодитися з тим, що в деяких випадках машина допускатиме помилки, а люди можуть легко їх вирішувати. Це складніше для чистої наскрізної системи.
Наприклад, і Waymo, і Cruise у Північній Америці зазнали багатьох аварій. Однак остання аварія Круза призвела до двох травм, хоча такі аварії є досить неминучими та прийнятними для людей-водіїв. Однак після цієї аварії система неправильно визначила місце аварії та місцезнаходження постраждалих і перейшла в режим зупинки, через що поранених довго тягнули. Така поведінка неприйнятна для будь-якого звичайного водія. Це не буде зроблено, і результати будуть дуже поганими.
Крім того, це тривожний сигнал про те, що ми повинні ретельно розглянути, як уникнути цієї ситуації під час розробки та експлуатації систем автономного водіння.
4. Отже, які на даний момент практичні рішення для наступного покоління масово вироблених систем допоміжного водіння?
Згідно з моїм поточним розумінням, під час використання так званої наскрізної моделі під час водіння після виведення траєкторії вона поверне рішення на основі традиційних методів. Крім того, планувальники на основі навчання та традиційні алгоритми планування траєкторії виводять кілька траєкторій одночасно, а потім вибирають одну траєкторію за допомогою селектора.
Таке приховане рішення та вибір обмежують верхню межу продуктивності цієї каскадної системи, якщо прийнято цю архітектуру системи. Якщо цей метод усе ще базується на чистому навчанні зі зворотним зв’язком, виникнуть непередбачувані збої, і мета бути безпечною взагалі не буде досягнута.
Якщо ми розглядаємо повторну оптимізацію або вибір за допомогою традиційних методів планування на цій вихідній траєкторії, це еквівалентно траєкторії, отриманій за допомогою методу, керованого навчанням; отже, чому б нам безпосередньо не оптимізувати та шукати цю траєкторію?
Звичайно, деякі люди скажуть, що така проблема оптимізації або пошуку не є опуклою, має великий простір станів і її неможливо запустити в режимі реального часу в системі автомобіля. Я прошу всіх уважно розглянути це питання: за останні десять років система сприйняття отримала принаймні в сто разів більший дивіденд обчислювальної потужності, але як щодо нашого модуля PnC?
Якщо ми також дозволимо модулю PnC використовувати велику обчислювальну потужність у поєднанні з деякими досягненнями в прогресивних алгоритмах оптимізації за останні роки, чи цей висновок усе ще правильний? Для такого роду проблем ми повинні розглянути, що є правильним з перших принципів.
5. Як узгодити зв’язок між методами, що керуються даними, і традиційними?
Гра в шахи є прикладом, дуже схожим на автономне водіння. У лютому цього року Deepmind опублікував статтю під назвою «Шахи гросмейстерського рівня без пошуку», в якій обговорювалося, чи можна використовувати лише пошук на основі даних і відмовитися від пошуку MCTS в AlphaGo та AlphaZero. Подібно до автономного водіння, лише одна мережа використовується для безпосереднього виведення дій, а всі наступні кроки ігноруються.
У статті робиться висновок, що, незважаючи на значні обсяги даних і параметрів моделі, досить розумні результати можна отримати без використання пошуку. Однак існують значні відмінності в порівнянні з методами, які використовують пошук. Це особливо корисно для вирішення деяких складних ендшпілів.
Для складних сценаріїв або кутових випадків, які вимагають багатокрокових ігор, ця аналогія все ще ускладнює повну відмову від традиційної оптимізації або алгоритмів пошуку. Розумне використання переваг різних технологій, таких як AlphaZero, є найкращим способом покращити продуктивність.
6. Традиційний метод = на основі правил, якщо ще?
Мені доводилося виправляти цю концепцію знову і знову, розмовляючи з багатьма людьми. Багато людей вважають, що якщо він не керується виключно даними, він не базується на правилах. Наприклад, у шахах запам’ятовування формул і шахових записів базується на правилах, але, як і AlphaGo та AlphaZero, воно дає моделі можливість бути раціональними за допомогою оптимізації та пошуку. Я не думаю, що це можна назвати правильним.
Через це сама велика модель наразі відсутня, і дослідники намагаються створити керовану навчанням модель за допомогою таких методів, як CoT. Однак, на відміну від завдань, які вимагають чистого розпізнавання зображень на основі даних і незрозумілих причин, кожна дія людини за кермом має чітку рушійну силу.
За відповідного дизайну архітектури алгоритму траєкторія прийняття рішень має стати змінною та однаково оптимізованою під керівництвом наукових цілей, а не примусово виправляти та коригувати параметри для виправлення різних випадків. Така система, природно, не має всіляких жорстко закодованих дивних правил.
Висновок
Коротше кажучи, наскрізне може бути багатообіцяючим технічним шляхом, але те, як застосовувати цю концепцію, потребує додаткових досліджень. Я думаю, що купа даних і параметрів моделі – не єдине правильне рішення, і якщо ми хочемо перевершити інших, нам потрібно продовжувати наполегливо працювати.
Час публікації: 24 квітня 2024 р