Автономды басқару жүйесін қалай анықтауға болады?
Ең кең тараған анықтама мынада: «ұшты-соңды» жүйе - өңделмеген сенсор туралы ақпаратты енгізетін және тапсырмаға қатысты айнымалы мәндерді тікелей шығаратын жүйе. Мысалы, кескінді тануда CNN дәстүрлі функция + классификатор әдісімен салыстырғанда «ұшты-ұшты» деп атауға болады.
Автономды жүргізу тапсырмаларында әртүрлі сенсорлардан алынған деректер (мысалы, камералар, LiDAR, Радар немесе IMU...) енгізіледі, ал көлік құралын басқару сигналдары (мысалы, дроссель немесе руль дөңгелегі бұрышы) тікелей шығарылады. Көлік құралының әртүрлі үлгілерінің бейімделу мәселелерін қарастыру үшін шығысты көлік құралының қозғалыс траекториясына қарай жеңілдетуге болады.
Осы негізге сүйене отырып, соңғы шығыс басқару сигналдарына немесе жол нүктелеріне қосымша сәйкес аралық тапсырмаларды бақылауды енгізу арқылы өнімділікті жақсартатын UniAD сияқты модульдік «соңғы» тұжырымдамалар да пайда болды. Дегенмен, мұндай тар анықтамадан «ұштыға» мәні сенсорлық ақпаратты жоғалтпай беру болуы керек.
Алдымен ұшты емес жүйелердегі сенсорлық және PnC модульдері арасындағы интерфейстерді қарастырайық. Әдетте біз ақ тізімге енгізілген нысандарды (мысалы, көліктер, адамдар және т.б.) анықтаймыз және олардың қасиеттерін талдап, болжаймыз. Біз сондай-ақ статикалық орта туралы білеміз (мысалы, жол құрылымы, жылдамдық шектеулері, бағдаршамдар және т.б.). Егер біз егжей-тегжейлі қарастырсақ, әмбебап кедергілерді де анықтар едік. Қысқаша айтқанда, бұл қабылдаулар арқылы шығарылатын ақпарат күрделі қозғалыс көріністерінің дисплей моделін құрайды.
Дегенмен, кейбір өте айқын көріністер үшін ағымдағы айқын абстракция көріністегі көлік жүргізу тәртібіне әсер ететін факторларды толық сипаттай алмайды немесе анықтауымыз керек тапсырмалар тым тривиальды және барлық қажетті тапсырмаларды санау қиын. Сондықтан, түпкілікті жүйелер PnC-де осы ақпаратпен автоматты түрде және шығынсыз әрекет ету үмітімен (мүмкін жанама түрде) жан-жақты ұсынуды қамтамасыз етеді. Менің ойымша, бұл талапты қанағаттандыра алатын барлық жүйелерді жалпылама «ұшты-ұшты» деп атауға болады.
Басқа мәселелерге келетін болсақ, мысалы, динамикалық өзара әрекеттесу сценарийлерінің кейбір оңтайландырулары, менің ойымша, кем дегенде, бұл проблемаларды тек ұшты-соңды ғана емес шеше алады, сонымен қатар ең жақсы шешім болмауы мүмкін. Дәстүрлі әдістер бұл мәселелерді шеше алады және, әрине, деректер көлемі жеткілікті үлкен болған кезде, end-to-end жақсы шешімді қамтамасыз етуі мүмкін.
Автономды жүргізуге қатысты кейбір түсінбеушілік
1. Басқару сигналдары мен жол нүктелері бір-бірінен соңына дейін шығарылуы керек.
Егер сіз жоғарыда талқыланған кең ауқымды тұжырымдамамен келісесіз, онда бұл мәселені түсіну оңай. Тапсырма көлемін тікелей шығаруға емес, «ұшты-ұшты» ақпаратты жоғалтпай жіберуге баса назар аудару керек. Тар ұшты-ұшты көзқарас көптеген қажетсіз қиындықтарды тудырады және қауіпсіздікті қамтамасыз ету үшін көптеген жасырын шешімдерді қажет етеді.
2.Ұқсас жүйе үлкен үлгілерге немесе таза көзқарасқа негізделуі керек.
Үздіксіз автономды жүргізу, үлкен модельді автономды жүргізу және таза визуалды автономды жүргізу арасында қажетті байланыс жоқ, өйткені олар толығымен тәуелсіз ұғымдар; «ұшты-ұшты» жүйе міндетті түрде үлкен үлгілермен басқарылмайды, сонымен қатар ол міндетті түрде таза көзқараспен басқарылады. бойынша.
3. Ұзақ мерзімді перспективада жоғарыда аталған «ұшты-ұшты» жүйе тар мағынада L3 деңгейінен жоғары автономды жүргізуге қол жеткізе алады ма?
Қазіргі уақытта таза FSD деп аталатын өнімділігі L3 деңгейінде талап етілетін сенімділік пен тұрақтылықты қанағаттандыру үшін жеткіліксіз. Ашығын айтқанда, егер өзін-өзі басқаратын жүйе жұртшылыққа ұнамды болғысы келсе, ең бастысы, жұртшылық кейбір жағдайларда машина қателесетінін және оны адамдар оңай шеше алатынын қабылдай ала ма? Бұл таза жүйе үшін қиынырақ.
Мысалы, Солтүстік Америкадағы Waymo және Cruise екеуі де көптеген апаттарға ұшырады. Дегенмен, Круиздің соңғы апаты екі жарақатқа әкелді, дегенмен мұндай апаттар адам жүргізушілер үшін сөзсіз және қолайлы. Алайда, осы апаттан кейін жүйе апат орнын және зардап шеккендердің орнын қате бағалап, түсіру режиміне түсіріп, жарақат алғандардың ұзақ уақыт бойы сүйретілуіне себеп болды. Бұл мінез-құлық кез келген қарапайым адам жүргізуші үшін қабылданбайды. Бұл орындалмайды және нәтиже өте нашар болады.
Сонымен қатар, бұл автономды жүргізу жүйелерін әзірлеу және пайдалану кезінде бұл жағдайды қалай болдырмау керектігін мұқият қарастыруымыз керек.
4.Сонымен, қазіргі уақытта жаппай шығарылатын қосалқы жүргізу жүйелерінің келесі буыны үшін қандай практикалық шешімдер бар?
Менің қазіргі түсінігім бойынша, көлік жүргізуде «ұшты-ұшты» деп аталатын модельді қолданғанда, траекторияны шығарғаннан кейін ол дәстүрлі әдістерге негізделген шешімді қайтарады. Сонымен қатар, оқытуға негізделген жоспарлаушылар және траекторияны жоспарлаудың дәстүрлі алгоритмдері бір уақытта бірнеше траекторияны шығарады, содан кейін селектор арқылы бір траекторияны таңдайды.
Мұндай жасырын шешім мен таңдау, егер бұл жүйе архитектурасы қабылданса, осы каскадтық жүйе өнімділігінің жоғарғы шегін шектейді. Егер бұл әдіс әлі де таза кері байланысты оқытуға негізделген болса, күтпеген сәтсіздіктер орын алады және қауіпсіз болу мақсатына мүлде қол жеткізілмейді.
Егер осы шығыс траекториясында дәстүрлі жоспарлау әдістерін пайдаланып қайта оңтайландыруды немесе таңдауды қарастыратын болсақ, бұл оқытуға негізделген әдіспен жасалған траекторияға тең; сондықтан неге біз бұл траекторияны тікелей оңтайландырмаймыз және іздемейміз?
Әрине, кейбір адамдар мұндай оңтайландыру немесе іздеу мәселесі дөңес емес, үлкен күй кеңістігі бар және көлік ішіндегі жүйеде нақты уақыт режимінде жұмыс істеу мүмкін емес деп айтады. Мен барлығын осы сұрақты мұқият қарастыруды өтінемін: Соңғы он жылда қабылдау жүйесі есептеу қабілетінен кем дегенде жүз есе артық дивиденд алды, бірақ біздің PnC модулі ше?
Егер біз PnC модуліне соңғы жылдардағы жетілдірілген оңтайландыру алгоритмдеріндегі кейбір жетістіктермен бірге үлкен есептеу қуатын пайдалануға рұқсат етсек, бұл тұжырым әлі де дұрыс па? Мұндай мәселе үшін біз бірінші принциптерден ненің дұрыс екенін қарастыруымыз керек.
5.Деректерге негізделген және дәстүрлі әдістер арасындағы қатынасты қалай үйлестіруге болады?
Шахмат ойнау - бұл автономды жүргізуге өте ұқсас мысал. Осы жылдың ақпан айында Deepmind AlphaGo және AlphaZero жүйелерінде тек деректерге негізделген іздеуді пайдалану және MCTS іздеуден бас тарту мүмкіндігін талқылайтын «Іздеусіз гроссмейстер деңгейіндегі шахмат» атты мақала жариялады. Автономды жүргізуге ұқсас, әрекеттерді тікелей шығару үшін тек бір желі пайдаланылады, ал келесі қадамдардың барлығы еленбейді.
Мақалада деректер мен үлгі параметрлерінің айтарлықтай көлеміне қарамастан, іздеуді пайдаланбай-ақ жеткілікті ақылға қонымды нәтижелерге қол жеткізуге болады деген қорытынды жасалады. Дегенмен, іздеуді пайдаланатын әдістермен салыстырғанда айтарлықтай айырмашылықтар бар. Бұл кейбір күрделі соңғы ойындармен күресу үшін әсіресе пайдалы.
Күрделі сценарийлер немесе көп сатылы ойындарды қажет ететін бұрыштық жағдайлар үшін бұл ұқсастық әлі де дәстүрлі оңтайландыру немесе іздеу алгоритмдерінен толығымен бас тартуды қиындатады. AlphaZero сияқты әртүрлі технологиялардың артықшылықтарын орынды пайдалану өнімділікті жақсартудың ең жақсы жолы болып табылады.
6. Дәстүрлі әдіс = ережеге негізделген, егер басқаша?
Көптеген адамдармен сөйлесе отырып, бұл тұжырымдаманы қайта-қайта түзетуге тура келді. Көптеген адамдар, егер ол тек деректерге негізделген болмаса, ережеге негізделмейді деп санайды. Мысалы, шахматта формулалар мен шахмат жазбаларын жатқа айту ережеге негізделген, бірақ AlphaGo және AlphaZero сияқты ол модельге оңтайландыру және іздеу арқылы ұтымды болу мүмкіндігін береді. Менің ойымша, оны ережеге негізделген деп атауға болмайды.
Осыған байланысты қазіргі уақытта үлкен модельдің өзі жоқ және зерттеушілер CoT сияқты әдістер арқылы оқытуға негізделген модельді ұсынуға тырысуда. Дегенмен, таза деректерге негізделген кескінді тануды және түсініксіз себептерді талап ететін тапсырмалардан айырмашылығы, көлік жүргізетін адамның әрбір әрекеті айқын қозғаушы күшке ие.
Сәйкес алгоритм архитектурасының дизайны бойынша шешім қабылдау траекториясы өзгермелі болуы керек және әртүрлі жағдайларды түзету үшін параметрлерді мәжбүрлеп түзету және реттеу емес, ғылыми мақсаттардың басшылығымен біркелкі оңтайландырылған болуы керек. Мұндай жүйеде, әрине, қатаң кодталған оғаш ережелердің барлық түрлері болмайды.
Қорытынды
Қысқасы, «ұшты-ұшты» перспективалы техникалық бағыт болуы мүмкін, бірақ тұжырымдаманың қалай қолданылатыны көбірек зерттеулерді қажет етеді. Менің ойымша, көптеген деректер мен модель параметрлері жалғыз дұрыс шешім емес, және егер біз басқалардан асып түскіміз келсе, біз көп жұмыс істеуіміз керек.
Жіберу уақыты: 24 сәуір-2024 ж