Скразныя сістэмы аўтаномнага кіравання: за рулём будучыні

Скразное аўтаномнае кіраванне

Як вызначыць скразную сістэму аўтаномнага кіравання?

Самае распаўсюджанае вызначэнне заключаецца ў тым, што сістэма "з канца ў канец" - гэта сістэма, якая ўводзіць неапрацаваную інфармацыю датчыка і непасрэдна выводзіць зменныя, звязаныя з задачай. Напрыклад, пры распазнаванні малюнкаў CNN можна назваць "скразным" у параўнанні з традыцыйным метадам прыкмета + класіфікатар.

 

У задачах аўтаномнага кіравання даныя з розных датчыкаў (такіх як камеры, LiDAR, радар або IMU...) уводзяцца, а сігналы кіравання аўтамабілем (напрыклад, дросель або вугал рулявога колы) выводзяцца непасрэдна. Каб разгледзець праблемы адаптацыі розных мадэляў транспартных сродкаў, вывад можа быць аслаблены ў залежнасці ад траекторыі руху аўтамабіля.

 

На аснове гэтай асновы таксама з'явіліся модульныя скразныя канцэпцыі, такія як UniAD, якія паляпшаюць прадукцыйнасць шляхам увядзення кантролю за адпаведнымі прамежкавымі задачамі ў дадатак да канчатковых выходных сігналаў кіравання або шляхавых кропак. Аднак з такога вузкага вызначэння сутнасцю скразнога павінна быць перадача сэнсарнай інфармацыі без страт.

 

Давайце спачатку разгледзім інтэрфейсы паміж модулямі зандзіравання і PnC у нескразных сістэмах. Звычайна мы выяўляем аб'екты з белага спісу (напрыклад, аўтамабілі, людзі і г.д.), аналізуем і прагназуем іх уласцівасці. Мы таксама даведаемся пра статычнае асяроддзе (напрыклад, структуру дарогі, абмежаванні хуткасці, святлафоры і г.д.). Калі б мы былі больш дэталёвымі, то выявілі б і ўніверсальныя перашкоды. Карацей кажучы, інфармацыя, якая выдаецца гэтым успрыманнем, уяўляе сабой мадэль адлюстравання складаных сцэн ваджэння.

 

Аднак для некаторых вельмі відавочных сцэн цяперашняя відавочная абстракцыя не можа цалкам апісаць фактары, якія ўплываюць на паводзіны ваджэння ў сцэне, або задачы, якія мы павінны вызначыць, занадта трывіяльныя, і цяжка пералічыць усе неабходныя задачы. Такім чынам, скразныя сістэмы забяспечваюць (магчыма, няяўна) поўнае прадстаўленне з надзеяй аўтаматычна і без страт дзейнічаць на PnC з гэтай інфармацыяй. На мой погляд, усе сістэмы, якія могуць задаволіць гэтае патрабаванне, можна назваць абагульненымі скразнымі.

 

Што тычыцца іншых пытанняў, такіх як некаторыя аптымізацыі сцэнарыяў дынамічнага ўзаемадзеяння, я лічу, што прынамсі не толькі канец у канец можа вырашыць гэтыя праблемы, і канец у канец можа быць не лепшым рашэннем. Традыцыйныя метады могуць вырашыць гэтыя праблемы, і, вядома, калі аб'ём даных досыць вялікі, скразны можа даць лепшае рашэнне.

Некаторыя непаразуменні адносна скразнога аўтаномнага кіравання

1. Кіруючыя сігналы і пуцявыя кропкі павінны выводзіцца скразнымі.

Калі вы згодныя з шырокай скразной канцэпцыяй, разгледжанай вышэй, то гэтую праблему лёгка зразумець. Скразная павінна падкрэсліваць перадачу інфармацыі без страт, а не прамы вывад аб'ёму задачы. Вузкі скразны падыход выкліча шмат непатрэбных праблем і запатрабуе мноства сакрэтных рашэнняў для забеспячэння бяспекі.

2. Скразная сістэма павінна быць заснавана на вялікіх мадэлях або чыстым бачанні.

Няма неабходнай сувязі паміж скразным аўтаномным кіраваннем, аўтаномным кіраваннем вялікіх мадэляў і чыста візуальным аўтаномным кіраваннем, таму што гэта цалкам незалежныя паняцці; скразная сістэма не абавязкова кіруецца вялікімі мадэлямі, і не абавязкова кіруецца чыстым бачаннем. з.

Скразная сістэма даследаванняў і распрацовак аўтаномнага кіравання

3. У доўгатэрміновай перспектыве, ці магчыма вышэйзгаданая скразная сістэма ў вузкім сэнсе дасягнуць аўтаномнага кіравання вышэй за ўзровень L3?

 

Прадукцыйнасць таго, што ў цяперашні час называецца чыстым скразным FSD, далёка не дастатковая для задавальнення надзейнасці і стабільнасці, неабходных на ўзроўні L3. Прасцей кажучы, калі сістэма самакіравання хоча быць прынятай грамадскасцю, ключавым з'яўляецца тое, ці можа грамадскасць прыняць, што ў некаторых выпадках машына будзе рабіць памылкі, а людзі могуць лёгка іх вырашыць. Гэта больш складана для чыста скразной сістэмы.

 

Напрыклад, у Waymo і Cruise у Паўночнай Амерыцы было шмат аварый. Аднак апошняя аварыя Круза прывяла да двух траўмаў, хоць такія аварыі даволі непазбежныя і прымальныя для кіроўцаў. Аднак пасля гэтай аварыі сістэма памылкова ацаніла месца аварыі і месцазнаходжанне пацярпелых і перайшла ў рэжым прыпынку, у выніку чаго пацярпелых доўга цягнулі. Такія паводзіны непрымальныя для любога нармальнага кіроўцы-чалавека. Гэта не будзе зроблена, і вынікі будуць вельмі дрэнныя.

 

Акрамя таго, гэта сігнал аб тым, што мы павінны ўважліва разгледзець, як пазбегнуць гэтай сітуацыі падчас распрацоўкі і эксплуатацыі сістэм аўтаномнага кіравання.

4. Такім чынам, якія на дадзены момант практычныя рашэнні для наступнага пакалення серыйных сістэм дапаможнага кіравання?

 

Паводле майго цяперашняга разумення, пры выкарыстанні так званай скразной мадэлі ў кіраванні пасля вываду траекторыі яна верне рашэнне, заснаванае на традыцыйных метадах. У якасці альтэрнатывы планіроўшчыкі на аснове навучання і традыцыйныя алгарытмы планавання траекторыі выводзяць некалькі траекторый адначасова, а затым выбіраюць адну траекторыю праз селектар.

 

Такога роду схаванае рашэнне і выбар абмяжоўвае верхнюю мяжу прадукцыйнасці гэтай каскаднай сістэмы, калі гэтая архітэктура сістэмы прынята. Калі гэты метад па-ранейшаму заснаваны на навучанні з чыстай зваротнай сувяззю, будуць адбывацца непрадказальныя збоі, і мэта быць у бяспецы не будзе дасягнута наогул.

 

Калі мы разглядаем паўторную аптымізацыю або выбар з выкарыстаннем традыцыйных метадаў планавання на гэтай траекторыі выхаду, гэта эквівалентна траекторыі, створанай метадам, арыентаваным на навучанне; таму чаму б нам непасрэдна не аптымізаваць і не шукаць гэтую траекторыю?

 

Вядома, некаторыя людзі сказалі б, што такая задача аптымізацыі або пошуку не з'яўляецца выпуклай, мае вялікую прастору стану і яе немагчыма запусціць у рэжыме рэальнага часу ў сістэме аўтамабіля. Я прашу ўсіх уважліва разгледзець гэтае пытанне: за апошнія дзесяць гадоў сістэма ўспрымання атрымала па меншай меры ў сто разоў большы дывідэнд вылічальнай магутнасці, але як наконт нашага модуля PnC?

 

Калі мы таксама дазволім модулю PnC выкарыстоўваць вялікую вылічальную магутнасць у спалучэнні з некаторымі дасягненнямі ў перадавых алгарытмах аптымізацыі ў апошнія гады, ці правільная гэтая выснова? Для такога роду праблем мы павінны разгледзець, што правільна з першых прынцыпаў.

5. Як прымірыць адносіны паміж кіраванымі дадзенымі і традыцыйнымі метадамі?

 

Гульня ў шахматы - прыклад, вельмі падобны да аўтаномнага кіравання. У лютым гэтага года Deepmind апублікаваў артыкул пад назвай «Шахматы на ўзроўні гросмайстра без пошуку», у якім абмяркоўвалася, ці магчыма выкарыстоўваць толькі кіраваны дадзенымі пошук і адмовіцца ад пошуку MCTS у AlphaGo і AlphaZero. Падобна аўтаномнаму кіраванню, толькі адна сетка выкарыстоўваецца для непасрэднага вываду дзеянняў, а ўсе наступныя крокі ігнаруюцца.

 

У артыкуле зроблена выснова, што, нягледзячы на ​​значныя аб'ёмы дадзеных і параметраў мадэлі, даволі разумныя вынікі можна атрымаць без выкарыстання пошуку. Аднак ёсць істотныя адрозненні ў параўнанні з метадамі з выкарыстаннем пошуку. Гэта асабліва карысна для працы са складанымі эндшпілямі.

 

Для складаных сцэнарыяў або кутніх выпадкаў, якія патрабуюць шматэтапных гульняў, гэтая аналогія па-ранейшаму робіць цяжкім поўны адмову ад традыцыйнай аптымізацыі або алгарытмаў пошуку. Разумнае выкарыстанне пераваг розных тэхналогій, такіх як AlphaZero, - лепшы спосаб палепшыць прадукцыйнасць.

Кіраванне аўтамабілем

6. Традыцыйны метад = заснаваны на правілах, калі яшчэ?

 

Мне даводзілася зноў і зноў выпраўляць гэтую канцэпцыю, размаўляючы з многімі людзьмі. Многія людзі лічаць, што пакуль ён не кіруецца выключна дадзенымі, ён не заснаваны на правілах. Напрыклад, у шахматах запамінанне формул і шахматных запісаў на памяць заснавана на правілах, але, як і AlphaGo і AlphaZero, гэта дае мадэлі магчымасць быць рацыянальным праз аптымізацыю і пошук. Я не думаю, што гэта можна назваць правілавым.

 

З-за гэтага сама вялікая мадэль у цяперашні час адсутнічае, і даследчыкі спрабуюць стварыць мадэль, арыентаваную на навучанне, з дапамогай такіх метадаў, як CoT. Аднак, у адрозненне ад задач, якія патрабуюць чыстага распазнання выявы на аснове даных і невытлумачальных прычын, кожнае дзеянне чалавека за рулём мае выразную рухаючую сілу.

 

Пры адпаведнай распрацоўцы архітэктуры алгарытму траекторыя прыняцця рашэння павінна стаць зменнай і раўнамерна аптымізавацца ў адпаведнасці з навуковымі мэтамі, а не прымусовым выпраўленнем і карэкціроўкай параметраў для выпраўлення розных выпадкаў. Такая сістэма, натуральна, не мае разнастайных жорстка закадзіраваных дзіўных правілаў.

Заключэнне

Карацей кажучы, скразны можа быць перспектыўным тэхнічным шляхам, але тое, як прымяняецца гэтая канцэпцыя, патрабуе дадатковых даследаванняў. Я думаю, што куча дадзеных і параметраў мадэлі - не адзінае правільнае рашэнне, і калі мы хочам пераўзысці іншых, мы павінны працягваць шмат працаваць.


Час публікацыі: 24 красавіка 2024 г