Si të përcaktohet një sistem autonom drejtimi nga fundi në fund?
Përkufizimi më i zakonshëm është se një sistem "nga fundi në fund" është një sistem që fut informacionin e papërpunuar të sensorit dhe nxjerr drejtpërdrejt variablat me interes për detyrën. Për shembull, në njohjen e imazhit, CNN mund të quhet "nga fundi në fund" krahasuar me metodën tradicionale të tipareve + klasifikues.
Në detyrat autonome të drejtimit, të dhënat nga sensorë të ndryshëm (si kamerat, LiDAR, Radari ose IMU...) futen dhe sinjalet e kontrollit të automjetit (si p.sh. këndi i mbytjes ose i timonit) dalin drejtpërdrejt. Për të marrë në konsideratë çështjet e përshtatjes së modeleve të ndryshme të automjeteve, dalja mund të relaksohet edhe në trajektoren e drejtimit të automjetit.
Bazuar në këtë bazë, janë shfaqur gjithashtu koncepte modulare nga fundi në fund, si UniAD, të cilat përmirësojnë performancën duke prezantuar mbikëqyrjen e detyrave përkatëse të ndërmjetme, përveç sinjaleve përfundimtare të kontrollit të daljes ose pikave. Sidoqoftë, nga një përkufizim kaq i ngushtë, thelbi i nga fundi në fund duhet të jetë transmetimi pa humbje i informacionit ndijor.
Le të shqyrtojmë fillimisht ndërfaqet midis moduleve sensore dhe PnC në sistemet jo-nga skaji në fund. Zakonisht, ne zbulojmë objekte në listën e bardhë (të tilla si makina, njerëz, etj.) dhe analizojmë dhe parashikojmë vetitë e tyre. Mësojmë gjithashtu për mjedisin statik (si struktura e rrugës, kufijtë e shpejtësisë, semaforët, etj.). Nëse do të ishim më të detajuar, do të zbulonim edhe pengesa universale. Shkurtimisht, informacioni i nxjerrë nga këto perceptime përbën një model të shfaqjes së skenave komplekse të drejtimit.
Megjithatë, për disa skena shumë të dukshme, abstraksioni aktual i qartë nuk mund të përshkruajë plotësisht faktorët që ndikojnë në sjelljen e drejtimit në skenë, ose detyrat që duhet të përcaktojmë janë shumë të parëndësishme dhe është e vështirë të numërohen të gjitha detyrat e kërkuara. Prandaj, sistemet nga skaji në fund ofrojnë një përfaqësim (ndoshta në mënyrë implicite) gjithëpërfshirëse me shpresën për të vepruar automatikisht dhe pa humbje në PnC me këtë informacion. Sipas mendimit tim, të gjitha sistemet që mund të plotësojnë këtë kërkesë mund të quhen të përgjithësuara nga fundi në fund.
Sa i përket çështjeve të tjera, si disa optimizime të skenarëve të ndërveprimit dinamik, besoj se të paktën jo vetëm nga fundi në fund mund t'i zgjidhë këto probleme dhe nga fundi në fund mund të mos jetë zgjidhja më e mirë. Metodat tradicionale mund t'i zgjidhin këto probleme, dhe sigurisht, kur sasia e të dhënave është mjaft e madhe, nga fundi në fund mund të ofrojë një zgjidhje më të mirë.
Disa keqkuptime rreth drejtimit autonom nga skaji në fund
1. Sinjalet e kontrollit dhe pikat e rrugës duhet të dalin që të jenë nga skaji në skaj.
Nëse jeni dakord me konceptin e gjerë nga fundi në fund të diskutuar më sipër, atëherë ky problem është i lehtë për t'u kuptuar. Nga skaji në fund duhet të theksojë transmetimin pa humbje të informacionit në vend që të nxjerrë drejtpërdrejt vëllimin e detyrës. Një qasje e ngushtë nga fundi në fund do të shkaktojë shumë telashe të panevojshme dhe do të kërkojë shumë zgjidhje të fshehta për të garantuar sigurinë.
2. Sistemi nga fundi në fund duhet të bazohet në modele të mëdha ose vizion të pastër.
Nuk ka asnjë lidhje të nevojshme midis drejtimit autonom nga skaji në skaj, drejtimit autonom të modelit të madh dhe drejtimit autonom thjesht vizual, sepse ato janë koncepte krejtësisht të pavarura; një sistem nga fundi në fund nuk drejtohet domosdoshmërisht nga modele të mëdha, as nuk drejtohet domosdoshmërisht nga vizioni i pastër. e.
3. Në terma afatgjatë, a është e mundur që sistemi i lartpërmendur nga skaji në fund në një kuptim të ngushtë të arrijë drejtimin autonom mbi nivelin L3?
Performanca e asaj që aktualisht quhet FSD e pastër nga skaji në fund nuk është aspak e mjaftueshme për të përmbushur besueshmërinë dhe stabilitetin e kërkuar në nivelin L3. Për ta thënë më troç, nëse sistemi vetë-drejtues dëshiron të pranohet nga publiku, çelësi është nëse publiku mund të pranojë që në disa raste, makina do të bëjë gabime dhe njerëzit mund t'i zgjidhin ato lehtësisht. Kjo është më e vështirë për një sistem të pastër nga fundi në fund.
Për shembull, si Waymo ashtu edhe Cruise në Amerikën e Veriut kanë pasur shumë aksidente. Megjithatë, aksidenti i fundit i Cruise rezultoi me dy lëndime, megjithëse aksidente të tilla janë mjaft të pashmangshme dhe të pranueshme për shoferët njerëzorë. Megjithatë, pas këtij aksidenti, sistemi vlerësoi gabim vendndodhjen e aksidentit dhe vendndodhjen e të plagosurit dhe e zvogëloi në modalitetin e tërheqjes, duke bërë që i dëmtuari të tërhiqej zvarrë për një kohë të gjatë. Kjo sjellje është e papranueshme për çdo shofer normal njerëzor. Nuk do të bëhet, dhe rezultatet do të jenë shumë të këqija.
Për më tepër, kjo është një alarm zgjimi që duhet të shqyrtojmë me kujdes se si ta shmangim këtë situatë gjatë zhvillimit dhe funksionimit të sistemeve autonome të drejtimit.
4. Pra, në këtë moment, cilat janë zgjidhjet praktike për gjeneratën e ardhshme të sistemeve të asistimit të vozitjes të prodhuara në masë?
Sipas të kuptuarit tim aktual, kur përdorni të ashtuquajturin model nga fundi në fund në drejtimin e makinës, pas daljes së trajektores, ai do të kthejë një zgjidhje të bazuar në metodat tradicionale. Përndryshe, planifikuesit e bazuar në mësim dhe algoritmet tradicionale të planifikimit të trajektores nxjerrin trajektore të shumta njëkohësisht dhe më pas zgjedhin një trajektore përmes një përzgjedhësi.
Kjo lloj zgjidhje dhe zgjedhje e fshehtë kufizon kufirin e sipërm të performancës së këtij sistemi kaskadë nëse kjo arkitekturë e sistemit miratohet. Nëse kjo metodë bazohet ende në të mësuarit e pastër me reagime, do të ndodhin dështime të paparashikueshme dhe qëllimi për të qenë i sigurt nuk do të arrihet fare.
Nëse marrim parasysh rioptimizimin ose përzgjedhjen duke përdorur metoda tradicionale të planifikimit në këtë trajektore dalëse, kjo është e barabartë me trajektoren e prodhuar nga metoda e drejtuar nga mësimi; prandaj, pse nuk e optimizojmë dhe nuk e kërkojmë drejtpërdrejt këtë trajektore?
Sigurisht, disa njerëz do të thoshin se një problem i tillë optimizimi ose kërkimi nuk është konveks, ka një hapësirë të madhe gjendjeje dhe është e pamundur të ekzekutohet në kohë reale në një sistem brenda automjetit. I bëj thirrje të gjithëve që ta marrin në konsideratë me kujdes këtë pyetje: Në dhjetë vitet e fundit, sistemi i perceptimit ka marrë të paktën njëqindfishin e dividendit të fuqisë kompjuterike, por çfarë ndodh me modulin tonë PnC?
Nëse lejojmë gjithashtu modulin PnC të përdorë fuqi të madhe llogaritëse, të kombinuara me disa përparime në algoritmet e avancuara të optimizimit në vitet e fundit, a është ende i saktë ky përfundim? Për këtë lloj problemi, duhet të shqyrtojmë se çfarë është e saktë nga parimet e para.
5.Si të pajtohen marrëdhëniet ndërmjet metodave të bazuara në të dhëna dhe atyre tradicionale?
Të luash shah është një shembull shumë i ngjashëm me drejtimin autonom. Në shkurt të këtij viti, Deepmind publikoi një artikull të quajtur "Grandmaster-Level Chess Without Search", duke diskutuar nëse është e mundur të përdoret vetëm e bazuar në të dhëna dhe të braktiset kërkimi MCTS në AlphaGo dhe AlphaZero. Ngjashëm me drejtimin autonom, vetëm një rrjet përdoret për të nxjerrë drejtpërdrejt veprimet, ndërsa të gjithë hapat e mëpasshëm shpërfillen.
Artikulli arrin në përfundimin se, pavarësisht sasive të konsiderueshme të të dhënave dhe parametrave të modelit, rezultate mjaft të arsyeshme mund të merren pa përdorur një kërkim. Megjithatë, ka dallime të konsiderueshme në krahasim me metodat që përdorin kërkimin. Kjo është veçanërisht e dobishme për t'u marrë me disa lojëra fundore komplekse.
Për skenarë komplekse ose raste qoshe që kërkojnë lojëra me shumë hapa, kjo analogji ende e bën të vështirë braktisjen e plotë të optimizimit tradicional ose algoritmeve të kërkimit. Përdorimi i arsyeshëm i avantazheve të teknologjive të ndryshme si AlphaZero është mënyra më e mirë për të përmirësuar performancën.
6. Metoda tradicionale = e bazuar në rregulla nëse tjetër?
Më është dashur ta korrigjoj këtë koncept pa pushim ndërsa flas me shumë njerëz. Shumë njerëz besojnë se për sa kohë që nuk drejtohet thjesht nga të dhënat, nuk bazohet në rregulla. Për shembull, në shah, memorizimi përmendësh i formulave dhe rekordeve të shahut bazohet në rregulla, por si AlphaGo dhe AlphaZero, ai i jep modelit aftësinë për të qenë racional përmes optimizimit dhe kërkimit. Nuk mendoj se mund të quhet e bazuar në rregulla.
Për shkak të kësaj, vetë modeli i madh aktualisht mungon dhe studiuesit po përpiqen të ofrojnë një model të drejtuar nga mësimi përmes metodave të tilla si CoT. Megjithatë, ndryshe nga detyrat që kërkojnë njohje të pastër të imazhit të drejtuar nga të dhënat dhe arsye të pashpjegueshme, çdo veprim i një personi që drejton ka një forcë të qartë lëvizëse.
Sipas dizajnit të duhur të arkitekturës së algoritmit, trajektorja e vendimit duhet të bëhet e ndryshueshme dhe të optimizohet në mënyrë uniforme nën drejtimin e qëllimeve shkencore, në vend që të korrigjojë dhe rregullojë me forcë parametrat për të rregulluar raste të ndryshme. Një sistem i tillë natyrisht nuk ka të gjitha llojet e rregullave të çuditshme të koduara.
konkluzioni
Shkurtimisht, nga fundi në fund mund të jetë një rrugë teknike premtuese, por se si zbatohet koncepti kërkon më shumë kërkime. Mendoj se një mori të dhënash dhe parametrash modeli nuk është zgjidhja e vetme e saktë dhe nëse duam t'i kalojmë të tjerët, duhet të vazhdojmë të punojmë shumë.
Koha e postimit: Prill-24-2024