Төгсгөлд бие даасан жолоодлогын системийг хэрхэн тодорхойлох вэ?
Хамгийн түгээмэл тодорхойлолт бол "төгсгөл" систем нь мэдрэгчийн түүхий мэдээллийг оруулж, даалгаварт хамааралтай хувьсагчдыг шууд гаргадаг систем юм. Жишээлбэл, дүрсийг танихад CNN-ийг уламжлалт онцлог + ангилагч аргатай харьцуулахад "төгсгөл" гэж нэрлэж болно.
Автономит жолоодлогын ажилд янз бүрийн мэдрэгчээс (камер, LiDAR, радар эсвэл IMU... гэх мэт) өгөгдлийг оруулдаг бөгөөд тээврийн хэрэгслийн хяналтын дохиог (жишээ нь тохируулагч эсвэл жолооны хүрдний өнцөг) шууд гаргадаг. Тээврийн хэрэгслийн янз бүрийн загварт дасан зохицох асуудлыг авч үзэхийн тулд гаралтыг тээврийн хэрэгслийн жолоодлогын замд тохируулж болно.
Энэхүү суурь дээр үндэслэн эцсийн гаралтын хяналтын дохио эсвэл замын цэгүүдээс гадна холбогдох завсрын ажлуудын хяналтыг нэвтрүүлэх замаар гүйцэтгэлийг сайжруулдаг UniAD гэх мэт модульчлагдсан төгсгөл хоорондын үзэл баримтлалууд бий болсон. Гэсэн хэдий ч ийм нарийн тодорхойлолтоос харахад төгсгөлийн мөн чанар нь мэдрэхүйн мэдээллийг алдагдалгүй дамжуулах явдал байх ёстой.
Эхлээд төгсгөлгүй систем дэх мэдрэгч ба PnC модулиудын хоорондох интерфейсийг авч үзье. Бид ихэвчлэн зөвшөөрөгдсөн жагсаалтад орсон объектуудыг (машин, хүмүүс гэх мэт) илрүүлж, тэдгээрийн шинж чанарыг шинжилж, таамагладаг. Мөн бид статик орчны (замын бүтэц, хурдны хязгаарлалт, гэрлэн дохио гэх мэт) талаар суралцдаг. Хэрэв бид илүү нарийвчилсан байсан бол бүх нийтийн саад бэрхшээлийг илрүүлэх байсан. Товчхондоо, эдгээр ойлголтуудын гаралтын мэдээлэл нь жолоодлогын нарийн төвөгтэй үзэгдлүүдийн дэлгэцийн загварыг бүрдүүлдэг.
Гэсэн хэдий ч зарим маш тодорхой үзэгдлийн хувьд одоогийн тодорхой хийсвэрлэл нь тухайн газар жолоодох зан төлөвт нөлөөлж буй хүчин зүйлсийг бүрэн дүрсэлж чадахгүй, эсвэл бидний тодорхойлох ёстой ажлууд нь хэтэрхий өчүүхэн бөгөөд шаардлагатай бүх ажлыг тоолоход хэцүү байдаг. Иймээс төгсгөл хоорондын системүүд нь PnC-д энэ мэдээлэлтэй автоматаар, алдагдалгүй ажиллах итгэл найдвар бүхий (магадгүй далд хэлбэрээр) иж бүрэн дүрслэлийг өгдөг. Миний бодлоор энэ шаардлагыг хангаж чадах бүх системийг ерөнхийд нь төгсгөл хүртэл гэж нэрлэж болно.
Динамик харилцан үйлчлэлийн хувилбаруудын зарим оновчлол гэх мэт бусад асуудлуудын хувьд, ядаж зөвхөн төгсгөл хүртэл эдгээр асуудлыг шийдэж чадахгүй, мөн төгсгөлөөс төгсгөл хүртэл нь хамгийн сайн шийдэл биш байж магадгүй гэж би үзэж байна. Уламжлалт аргууд нь эдгээр асуудлыг шийдэж чадна, мэдээжийн хэрэг, өгөгдлийн хэмжээ хангалттай том бол төгсгөлөөс төгсгөл хүртэл илүү сайн шийдлийг гаргаж чадна.
Автономит жолоодлогын талаархи зарим үл ойлголцол
1. Хяналтын дохио ба замын цэгүүд нь төгсгөл хүртэл байх ёстой.
Хэрэв та дээр дурдсан өргөн хүрээний үзэл баримтлалтай санал нийлж байгаа бол энэ асуудлыг ойлгоход хялбар болно. Даалгаврын хэмжээг шууд гаргахаас илүүтэйгээр мэдээллийг алдагдалгүй дамжуулахыг чухалчлах ёстой. Төгсгөлийн нарийн арга нь шаардлагагүй асуудал үүсгэж, аюулгүй байдлыг хангахын тулд маш олон далд шийдлийг шаарддаг.
2.Төгсгөлийн систем нь том загвар эсвэл цэвэр алсын хараа дээр суурилсан байх ёстой.
Төгсгөлд бие даасан жолоодлого, том загварт бие даасан жолоодлого, харааны бие даасан жолоодлого хоёрын хооронд зайлшгүй холбоо байхгүй, учир нь эдгээр нь бүрэн бие даасан ойлголт юм; Төгсгөлийн систем нь том загваруудаар удирдагдах албагүй, мөн цэвэр алсын хараатай байх албагүй. -ийн.
3. Урт хугацаанд дээр дурдсан төгсгөлийн систем нь явцуу утгаараа L3 түвшингээс дээш бие даасан жолоодлоготой болох боломжтой юу?
Одоогийн байдлаар цэвэр төгсгөлтэй FSD гэж нэрлэгддэг гүйцэтгэл нь L3 түвшинд шаардагдах найдвартай, тогтвортой байдлыг хангахад хангалттай биш юм. Бүр шулуухан хэлэхэд, өөрөө жолоодлоготой систем нь олон нийтэд хүлээн зөвшөөрөгдөхийг хүсч байгаа бол зарим тохиолдолд машин алдаа гаргадгийг олон нийт хүлээн зөвшөөрч чадах эсэх нь гол асуудал бөгөөд үүнийг хүн өөрөө амархан шийдэж чадна. Энэ нь цэвэр төгсгөлийн системийн хувьд илүү хэцүү байдаг.
Жишээлбэл, Хойд Америкийн Waymo болон Cruise хоёулаа олон осолд өртсөн. Гэсэн хэдий ч Cruise-ийн сүүлчийн ослоор хоёр хүн бэртэж гэмтсэн боловч ийм осол нь хүний жолооч нарын хувьд зайлшгүй бөгөөд хүлээн зөвшөөрөгдөхүйц байдаг. Гэвч энэ ослын дараа уг систем ослын газар, бэртэж гэмтсэн хүмүүсийн байршлыг буруу үнэлж, буулгах горимд шилжүүлснээр бэртэж гэмтсэн хүмүүсийг удаан хугацаагаар чирэхэд хүргэсэн. Энэ зан үйлийг энгийн хүний ямар ч жолооч хүлээн зөвшөөрч болохгүй. Үүнийг хийхгүй, үр дүн нь маш муу байх болно.
Цаашилбал, энэ нь бие даасан жолоодлогын системийг хөгжүүлэх, ажиллуулах явцад ийм нөхцөл байдлаас хэрхэн зайлсхийх талаар сайтар бодож үзэх ёстой сэрэмжлүүлэг юм.
4.Одоогийн байдлаар, бөөнөөр үйлдвэрлэсэн туслах жолоодлогын дараагийн үеийн практик шийдлүүд юу вэ?
Миний одоогийн ойлголтоор бол төгсгөлөөс төгсгөл гэж нэрлэгддэг загварыг жолоодоход ашиглахдаа траекторийг гаргасны дараа уламжлалт аргад суурилсан шийдлийг буцаана. Өөрөөр, суралцахад суурилсан төлөвлөгчид болон уламжлалт замнал төлөвлөлтийн алгоритмууд нь нэгэн зэрэг олон замналыг гаргаж, дараа нь сонгогчоор дамжуулан нэг траекторийг сонгоно.
Ийм далд шийдэл, сонголт нь энэ системийн архитектурыг ашиглах тохиолдолд энэ каскадын системийн гүйцэтгэлийн дээд хязгаарыг хязгаарладаг. Хэрэв энэ арга нь цэвэр санал хүсэлтийг судлахад үндэслэсэн хэвээр байвал урьдчилан таамаглах аргагүй бүтэлгүйтэл гарч, аюулгүй байх зорилгод огтхон ч хүрэхгүй.
Хэрэв бид энэхүү гаралтын зам дээр уламжлалт төлөвлөлтийн аргуудыг ашиглан дахин оновчтой болгох эсвэл сонгохыг авч үзвэл энэ нь суралцахад тулгуурласан аргын дагуу хийгдсэн замналтай тэнцэнэ; Тиймээс бид яагаад энэ замыг шууд оновчтой болгож, хайж болохгүй гэж?
Мэдээжийн хэрэг, зарим хүмүүс ийм оновчлол эсвэл хайлтын асуудал нь гүдгэр бус, том төлөвийн зайтай, тээврийн хэрэгслийн систем дээр бодит цаг хугацаанд ажиллах боломжгүй гэж хэлэх болно. Би хүн бүрээс энэ асуултыг сайтар бодож үзэхийг хүсч байна: Сүүлийн арван жилийн хугацаанд ойлголтын систем нь тооцоолох чадвараас дор хаяж зуу дахин их хэмжээний ногдол ашиг авч байсан бол манай PnC модуль яах вэ?
Хэрэв бид PnC модулийг сүүлийн жилүүдэд дэвшилтэт оновчлолын алгоритмуудын зарим дэвшилттэй хослуулан их хэмжээний тооцоолох хүчийг ашиглахыг зөвшөөрвөл энэ дүгнэлт зөв хэвээр байна уу? Энэ төрлийн асуудлын хувьд бид эхний зарчмаас эхлээд юу зөв болохыг анхаарч үзэх хэрэгтэй.
5.Өгөгдөлд тулгуурласан болон уламжлалт аргуудын хоорондын хамаарлыг хэрхэн уялдуулах вэ?
Шатар тоглох нь бие даасан жолоодлоготой маш төстэй жишээ юм. Энэ оны 2-р сард Deepmind нь AlphaGo болон AlphaZero дээр зөвхөн өгөгдөлд тулгуурласан MCTS хайлтыг ашиглах боломжгүй эсэх талаар ярилцсан "Хайлтгүй их мастер түвшний шатар" нэртэй нийтлэл нийтлүүлсэн. Автономит жолоодлоготой адил үйлдлүүдийг шууд гаргахын тулд зөвхөн нэг сүлжээг ашигладаг бөгөөд дараагийн бүх алхмуудыг үл тоомсорлодог.
Их хэмжээний өгөгдөл, загварын параметрүүдийг үл харгалзан хайлт хийхгүйгээр нэлээд боломжийн үр дүнд хүрч чадна гэж нийтлэлд дүгнэжээ. Гэсэн хэдий ч хайлтыг ашигладаг аргуудтай харьцуулахад мэдэгдэхүйц ялгаа байдаг. Энэ нь зарим төвөгтэй төгсгөлийн тоглоомуудтай харьцахад ялангуяа ашигтай байдаг.
Олон шатлалт тоглоом шаарддаг нарийн төвөгтэй хувилбарууд эсвэл булангийн тохиолдлуудын хувьд энэ зүйрлэл нь уламжлалт оновчлол эсвэл хайлтын алгоритмаас бүрэн татгалзахад хэцүү хэвээр байна. AlphaZero зэрэг янз бүрийн технологийн давуу талыг үндэслэлтэй ашиглах нь гүйцэтгэлийг сайжруулах хамгийн сайн арга юм.
6.Уламжлалт арга = дүрэмд суурилсан бол өөр үү?
Би олон хүнтэй ярилцаж байхдаа энэ ойлголтыг дахин дахин засах шаардлагатай болсон. Энэ нь зөвхөн өгөгдөлд тулгуурлаагүй л бол дүрэмд суурилдаггүй гэдэгт олон хүн итгэдэг. Жишээлбэл, шатрын төрөлд томъёо, шатрын бичлэгийг цээжлэх нь дүрэмд тулгуурладаг боловч AlphaGo болон AlphaZero шиг загварт оновчтой болгох, хайх замаар оновчтой байх чадварыг өгдөг. Үүнийг дүрэмд суурилсан гэж хэлж болохгүй гэж бодож байна.
Үүнээс болж том загвар нь одоогоор байхгүй байгаа бөгөөд судлаачид CoT гэх мэт аргуудаар дамжуулан суралцахад тулгуурласан загварыг гаргахыг оролдож байна. Гэсэн хэдий ч цэвэр өгөгдөлд тулгуурласан дүрсийг таних, тайлбарлах боломжгүй шалтгаан шаарддаг ажлуудаас ялгаатай нь жолоо барьж буй хүний үйлдэл бүр тодорхой хөдөлгөгч хүчтэй байдаг.
Зохих алгоритмын архитектурын дизайны дагуу шийдвэр гаргах зам нь хувьсах шинж чанартай болж, өөр өөр тохиолдлуудыг засахын тулд параметрүүдийг хүчээр нөхөж, тохируулахын оронд шинжлэх ухааны зорилгын удирдлаган дор жигд оновчтой байх ёстой. Ийм системд бүх төрлийн хатуу кодлогдсон хачирхалтай дүрэм байдаггүй.
Дүгнэлт
Товчхондоо, төгсгөлөөс төгсгөл нь ирээдүйтэй техникийн зам байж болох ч үзэл баримтлалыг хэрхэн хэрэгжүүлэх талаар илүү их судалгаа шаарддаг. Олон тооны өгөгдөл, загварын параметрүүд нь цорын ганц зөв шийдэл биш бөгөөд хэрэв бид бусдыг давахыг хүсч байвал шаргуу ажиллах хэрэгтэй гэж би бодож байна.
Шуудангийн цаг: 2024 оны 4-р сарын 24