Bagaimana untuk menentukan sistem pemanduan autonomi hujung ke hujung?
Takrifan yang paling biasa ialah sistem "hujung-ke-hujung" ialah sistem yang memasukkan maklumat penderia mentah dan secara langsung mengeluarkan pembolehubah kebimbangan kepada tugas. Contohnya, dalam pengecaman imej, CNN boleh dipanggil "hujung ke hujung" berbanding dengan kaedah ciri + pengelas tradisional.
Dalam tugas pemanduan autonomi, data daripada pelbagai penderia (seperti kamera, LiDAR, Radar atau IMU...) ialah input dan isyarat kawalan kenderaan (seperti pendikit atau sudut stereng) dikeluarkan secara langsung. Untuk mempertimbangkan isu penyesuaian model kenderaan yang berbeza, output juga boleh dilonggarkan kepada trajektori pemanduan kenderaan.
Berdasarkan asas ini, konsep hujung ke hujung modular juga telah muncul, seperti UniAD, yang meningkatkan prestasi dengan memperkenalkan penyeliaan tugas perantaraan yang berkaitan, sebagai tambahan kepada isyarat kawalan keluaran akhir atau titik laluan. Walau bagaimanapun, daripada takrifan yang begitu sempit, intipati hujung-ke-hujung haruslah penghantaran tanpa kehilangan maklumat deria.
Mari kita semak dahulu antara muka antara penderiaan dan modul PnC dalam sistem bukan hujung ke hujung. Biasanya, kami mengesan objek yang disenarai putih (seperti kereta, orang, dll.) dan menganalisis serta meramalkan sifatnya. Kami juga belajar tentang persekitaran statik (seperti struktur jalan, had laju, lampu isyarat, dll.). Jika kami lebih terperinci, kami juga akan mengesan halangan sejagat. Ringkasnya, output maklumat oleh persepsi ini membentuk model paparan adegan pemanduan yang kompleks.
Walau bagaimanapun, untuk beberapa adegan yang sangat jelas, abstraksi eksplisit semasa tidak dapat menerangkan sepenuhnya faktor yang mempengaruhi tingkah laku memandu di tempat kejadian, atau tugas yang perlu kami tentukan adalah terlalu remeh, dan sukar untuk menghitung semua tugas yang diperlukan. Oleh itu, sistem hujung ke hujung menyediakan perwakilan komprehensif (mungkin secara tersirat) dengan harapan untuk bertindak secara automatik dan tanpa kerugian pada PnC dengan maklumat ini. Pada pendapat saya, semua sistem yang boleh memenuhi keperluan ini boleh dipanggil menyeluruh dari hujung ke hujung.
Bagi isu lain, seperti beberapa pengoptimuman senario interaksi dinamik, saya percaya bahawa sekurang-kurangnya bukan sahaja hujung ke hujung boleh menyelesaikan masalah ini, dan hujung ke hujung mungkin bukan penyelesaian terbaik. Kaedah tradisional boleh menyelesaikan masalah ini, dan sudah tentu, apabila jumlah data cukup besar, hujung ke hujung mungkin memberikan penyelesaian yang lebih baik.
Beberapa salah faham tentang pemanduan autonomi hujung ke hujung
1. Isyarat kawalan dan titik laluan mestilah output untuk hujung ke hujung.
Jika anda bersetuju dengan konsep luas hujung ke hujung yang dibincangkan di atas, maka masalah ini mudah difahami. Hujung-ke-hujung harus menekankan penghantaran maklumat tanpa kerugian dan bukannya secara langsung mengeluarkan jumlah tugas. Pendekatan hujung ke hujung yang sempit akan menyebabkan banyak masalah yang tidak perlu dan memerlukan banyak penyelesaian rahsia untuk memastikan keselamatan.
2. Sistem hujung ke hujung mestilah berdasarkan model besar atau penglihatan tulen.
Tiada hubungan yang diperlukan antara pemanduan autonomi hujung ke hujung, pemanduan autonomi model besar dan pemanduan autonomi visual semata-mata kerana ia adalah konsep bebas sepenuhnya; sistem hujung ke hujung tidak semestinya didorong oleh model besar, dan tidak semestinya didorong oleh penglihatan tulen. daripada.
3.Dalam jangka panjang, adakah mungkin sistem hujung ke hujung yang dinyatakan di atas dalam erti kata yang sempit untuk mencapai pemanduan autonomi melebihi tahap L3?
Prestasi apa yang kini dipanggil FSD hujung ke hujung tulen adalah jauh dari mencukupi untuk memenuhi kebolehpercayaan dan kestabilan yang diperlukan pada tahap L3. Secara lebih terang, jika sistem pandu kendiri mahu diterima oleh orang ramai, kuncinya ialah sama ada orang ramai boleh menerima bahawa dalam beberapa kes, mesin akan melakukan kesilapan, dan manusia boleh menyelesaikannya dengan mudah. Ini lebih sukar untuk sistem hujung ke hujung tulen.
Contohnya, Waymo dan Cruise di Amerika Utara telah mengalami banyak kemalangan. Bagaimanapun, kemalangan terakhir Cruise mengakibatkan dua kecederaan, walaupun kemalangan seperti itu tidak dapat dielakkan dan boleh diterima oleh pemandu manusia. Bagaimanapun, selepas kemalangan ini, sistem tersalah menilai lokasi kemalangan dan lokasi yang cedera dan diturunkan kepada mod tarik balik, menyebabkan mereka yang cedera diseret untuk masa yang lama. Tingkah laku ini tidak boleh diterima oleh mana-mana pemandu manusia biasa. Ia tidak akan dilakukan, dan hasilnya akan menjadi sangat buruk.
Tambahan pula, ini adalah panggilan bangun yang harus kita pertimbangkan dengan teliti cara mengelakkan situasi ini semasa pembangunan dan pengendalian sistem pemanduan autonomi.
4. Jadi pada masa ini, apakah penyelesaian praktikal untuk sistem pemanduan berbantu yang dihasilkan secara besar-besaran akan datang?
Mengikut pemahaman saya sekarang, apabila menggunakan model hujung ke hujung dalam pemanduan, selepas mengeluarkan trajektori, ia akan mengembalikan penyelesaian berdasarkan kaedah tradisional. Sebagai alternatif, perancang berasaskan pembelajaran dan algoritma perancangan trajektori tradisional mengeluarkan berbilang trajektori secara serentak dan kemudian memilih satu trajektori melalui pemilih.
Penyelesaian dan pilihan rahsia jenis ini mengehadkan had atas prestasi sistem lata ini jika seni bina sistem ini diguna pakai. Jika kaedah ini masih berdasarkan pembelajaran maklum balas tulen, kegagalan yang tidak dapat diramalkan akan berlaku dan matlamat untuk selamat tidak akan tercapai sama sekali.
Jika kita mempertimbangkan untuk mengoptimumkan semula atau memilih menggunakan kaedah perancangan tradisional pada trajektori output ini, ini adalah bersamaan dengan trajektori yang dihasilkan oleh kaedah dipacu pembelajaran; oleh itu, mengapa kita tidak mengoptimumkan dan mencari trajektori ini secara langsung?
Sudah tentu, sesetengah orang akan mengatakan bahawa masalah pengoptimuman atau carian sedemikian adalah tidak cembung, mempunyai ruang keadaan yang besar dan mustahil untuk dijalankan dalam masa nyata pada sistem dalam kenderaan. Saya mohon semua orang untuk mempertimbangkan soalan ini dengan teliti: Dalam sepuluh tahun yang lalu, sistem persepsi telah menerima sekurang-kurangnya seratus kali ganda dividen kuasa pengkomputeran, tetapi bagaimana pula dengan modul PnC kami?
Jika kami juga membenarkan modul PnC menggunakan kuasa pengkomputeran yang besar, digabungkan dengan beberapa kemajuan dalam algoritma pengoptimuman lanjutan dalam beberapa tahun kebelakangan ini, adakah kesimpulan ini masih betul? Untuk masalah seperti ini, kita harus mempertimbangkan apa yang betul dari prinsip pertama.
5. Bagaimana untuk menyelaraskan hubungan antara kaedah yang dipacu data dan tradisional?
Bermain catur adalah contoh yang hampir sama dengan pemanduan autonomi. Pada Februari tahun ini, Deepmind menerbitkan artikel yang dipanggil "Catur Peringkat Grandmaster Tanpa Carian", membincangkan sama ada ia boleh dilaksanakan untuk hanya menggunakan dipacu data dan meninggalkan carian MCTS dalam AlphaGo dan AlphaZero. Sama seperti pemanduan autonomi, hanya satu rangkaian digunakan untuk mengeluarkan tindakan secara langsung, manakala semua langkah seterusnya diabaikan.
Artikel tersebut menyimpulkan bahawa, walaupun terdapat sejumlah besar data dan parameter model, hasil yang agak munasabah boleh diperolehi tanpa menggunakan carian. Walau bagaimanapun, terdapat perbezaan yang ketara berbanding kaedah menggunakan carian. Ini amat berguna untuk menangani beberapa permainan akhir yang kompleks.
Untuk senario kompleks atau kes sudut yang memerlukan permainan berbilang langkah, analogi ini masih menyukarkan untuk meninggalkan sepenuhnya pengoptimuman tradisional atau algoritma carian. Menggunakan kelebihan pelbagai teknologi seperti AlphaZero adalah cara terbaik untuk meningkatkan prestasi.
6.Kaedah tradisional = berasaskan peraturan jika lain?
Saya terpaksa membetulkan konsep ini berulang kali semasa bercakap dengan ramai orang. Ramai orang percaya bahawa selagi ia bukan berasaskan data semata-mata, ia bukan berasaskan peraturan. Contohnya, dalam catur, menghafal formula dan rekod catur mengikut hafalan adalah berasaskan peraturan, tetapi seperti AlphaGo dan AlphaZero, ia memberikan model keupayaan untuk menjadi rasional melalui pengoptimuman dan carian. Saya tidak fikir ia boleh dipanggil berasaskan peraturan.
Disebabkan ini, model besar itu sendiri kini hilang, dan penyelidik cuba menyediakan model yang didorong pembelajaran melalui kaedah seperti CoT. Walau bagaimanapun, tidak seperti tugas yang memerlukan pengecaman imej terdorong data tulen dan sebab yang tidak dapat dijelaskan, setiap tindakan seseorang yang memandu mempunyai daya penggerak yang jelas.
Di bawah reka bentuk seni bina algoritma yang sesuai, trajektori keputusan harus berubah-ubah dan dioptimumkan secara seragam di bawah bimbingan matlamat saintifik, dan bukannya menampal dan menyesuaikan parameter secara paksa untuk membetulkan kes yang berbeza. Sistem sedemikian secara semula jadi tidak mempunyai semua jenis peraturan aneh berkod keras.
Kesimpulan
Pendek kata, hujung ke hujung mungkin merupakan laluan teknikal yang menjanjikan, tetapi cara konsep itu digunakan memerlukan lebih banyak penyelidikan. Saya fikir sekumpulan parameter data dan model bukanlah satu-satunya penyelesaian yang betul, dan jika kita mahu mengatasi yang lain, kita perlu terus bekerja keras.
Masa siaran: Apr-24-2024