Uçtan uca otonom sürüş sistemi nasıl tanımlanır?
En yaygın tanım, "uçtan uca" bir sistemin, ham sensör bilgilerini giren ve göreve ilişkin değişkenleri doğrudan çıkaran bir sistem olduğudur. Örneğin görüntü tanımada CNN, geleneksel özellik + sınıflandırıcı yöntemiyle karşılaştırıldığında "uçtan uca" olarak adlandırılabilir.
Otonom sürüş görevlerinde, çeşitli sensörlerden (kameralar, LiDAR, Radar veya IMU... gibi) gelen veriler girilir ve araç kontrol sinyalleri (gaz kelebeği veya direksiyon simidi açısı gibi) doğrudan çıkarılır. Farklı araç modellerinin adaptasyon sorunlarını dikkate almak için çıktı, aracın sürüş yörüngesine göre de gevşetilebilir.
Bu temele dayanarak, nihai çıkış kontrol sinyallerine veya ara noktalara ek olarak ilgili ara görevlerin denetimini sunarak performansı artıran UniAD gibi modüler uçtan uca konseptler de ortaya çıktı. Ancak bu kadar dar bir tanımdan yola çıkarak uçtan uca özün, duyusal bilginin kayıpsız iletimi olması gerekir.
Öncelikle uçtan uca olmayan sistemlerde algılama ve PnC modülleri arasındaki arayüzleri inceleyelim. Genellikle beyaz listeye alınmış nesneleri (arabalar, insanlar vb.) tespit eder ve özelliklerini analiz edip tahmin ederiz. Ayrıca statik ortam hakkında da bilgi ediniriz (yol yapısı, hız limitleri, trafik ışıkları vb.). Daha detaylı olsaydık evrensel engelleri de tespit ederdik. Kısacası bu algıların ortaya çıkardığı bilgi, karmaşık sürüş sahnelerinin bir gösterim modelini oluşturmaktadır.
Ancak bazı çok bariz sahneler için mevcut açık soyutlama, sahnedeki sürüş davranışını etkileyen faktörleri tam olarak tanımlayamıyor veya tanımlamamız gereken görevler çok önemsiz ve gerekli tüm görevleri sıralamak zor. Bu nedenle uçtan uca sistemler, bu bilgilerle PnC'ler üzerinde otomatik ve kayıpsız bir şekilde hareket etme umuduyla (belki de örtülü olarak) kapsamlı bir temsil sağlar. Bana göre bu gereksinimi karşılayabilecek tüm sistemlere uçtan uca genelleştirilmiş denilebilir.
Dinamik etkileşim senaryolarının bazı optimizasyonları gibi diğer konulara gelince, en azından uçtan uca bu sorunları çözemeyeceğine ve uçtan uca en iyi çözüm olmayabileceğine inanıyorum. Geleneksel yöntemler bu sorunları çözebilir ve elbette veri miktarı yeterince büyük olduğunda uçtan uca daha iyi bir çözüm sağlayabilir.
Uçtan uca otonom sürüşe ilişkin bazı yanlış anlaşılmalar
1. Kontrol sinyalleri ve yol noktalarının çıkışı uçtan uca olacak şekilde verilmelidir.
Yukarıda tartışılan geniş uçtan uca kavramı kabul ediyorsanız, bu sorunun anlaşılması kolaydır. Uçtan uca, görev hacminin doğrudan çıktısını almak yerine bilgilerin kayıpsız aktarımını vurgulamalıdır. Uçtan uca dar bir yaklaşım, pek çok gereksiz soruna neden olacak ve güvenliği sağlamak için çok sayıda gizli çözüm gerektirecektir.
2.Uçtan uca sistem büyük modellere veya saf vizyona dayanmalıdır.
Uçtan uca otonom sürüş, büyük model otonom sürüş ve tamamen görsel otonom sürüş arasında gerekli bir bağlantı yoktur çünkü bunlar tamamen bağımsız kavramlardır; uçtan uca bir sistemin mutlaka büyük modellerle veya saf vizyonla desteklenmesi gerekmez. ile ilgili.
3. Uzun vadede yukarıda bahsedilen uçtan uca sistemin dar anlamda L3 seviyesinin üzerinde otonom sürüşe ulaşması mümkün müdür?
Şu anda saf uçtan uca FSD olarak adlandırılan şeyin performansı, L3 düzeyinde gereken güvenilirliği ve kararlılığı karşılamaktan çok uzaktır. Daha açık bir ifadeyle, eğer otonom sürüş sistemi halk tarafından kabul edilmek istiyorsa, önemli olan halkın bazı durumlarda makinenin hata yapacağını ve insanların bunları kolayca çözebileceğini kabul edip edemeyeceğidir. Saf bir uçtan uca sistem için bu daha zordur.
Örneğin Kuzey Amerika'da hem Waymo hem de Cruise çok sayıda kaza geçirdi. Ancak Cruise'un son kazası iki yaralanmayla sonuçlandı, ancak bu tür kazalar insan sürücüler için oldukça kaçınılmaz ve kabul edilebilir. Ancak bu kazadan sonra sistem kazanın yerini ve yaralıların yerini yanlış değerlendirip çekme moduna geçerek yaralıların uzun süre sürüklenmesine neden oldu. Bu davranış herhangi bir normal insan sürücü için kabul edilemez. Bu yapılmayacak ve sonuçları çok kötü olacak.
Ayrıca bu, otonom sürüş sistemlerinin geliştirilmesi ve işletilmesi sırasında bu durumun nasıl önlenebileceğini dikkatle düşünmemiz gerektiğine dair bir uyandırma çağrısıdır.
4. Peki şu anda yeni nesil seri üretim destekli sürüş sistemleri için pratik çözümler neler?
Şu andaki anlayışıma göre, uçtan uca denilen modeli sürüşte kullanırken, yörünge çıktısını aldıktan sonra geleneksel yöntemlere dayalı bir çözüm döndürecektir. Alternatif olarak, öğrenmeye dayalı planlayıcılar ve geleneksel yörünge planlama algoritmaları, aynı anda birden fazla yörüngenin çıktısını alır ve ardından bir seçici aracılığıyla bir yörünge seçer.
Bu tür gizli çözüm ve seçim, bu sistem mimarisinin benimsenmesi durumunda, bu kaskad sistemin performansının üst sınırını sınırlar. Bu yöntem hala saf geri bildirim öğrenmeye dayalıysa, öngörülemeyen hatalar meydana gelecek ve güvenli olma hedefine hiçbir şekilde ulaşılamayacaktır.
Bu çıktı yörüngesinde geleneksel planlama yöntemlerini kullanarak yeniden optimize etmeyi veya seçmeyi düşünürsek, bu, öğrenme odaklı yöntemin ürettiği yörüngeye eşdeğerdir; bu nedenle neden bu gidişatı doğrudan optimize edip araştırmıyoruz?
Elbette bazı insanlar böyle bir optimizasyon veya arama probleminin dışbükey olmadığını, geniş bir durum alanına sahip olduğunu ve araç içi bir sistemde gerçek zamanlı olarak çalıştırılmasının imkansız olduğunu söyleyebilir. Herkesin şu soruyu dikkatlice düşünmesini rica ediyorum: Geçtiğimiz on yılda, algı sistemi bilgi işlem gücünden en az yüz kat fazla pay aldı, peki ya PnC modülümüz?
Son yıllarda gelişmiş optimizasyon algoritmalarındaki bazı ilerlemelerle birlikte PnC modülünün büyük bilgi işlem gücü kullanmasına da izin verirsek, bu sonuç hala doğru mudur? Bu tür bir sorun için ilk prensiplerden itibaren neyin doğru olduğunu düşünmeliyiz.
5.Veriye dayalı ve geleneksel yöntemler arasındaki ilişki nasıl uzlaştırılır?
Satranç oynamak otonom sürüşe çok benzeyen bir örnektir. Bu yılın Şubat ayında Deepmind, AlphaGo ve AlphaZero'da yalnızca veri odaklı kullanmanın ve MCTS aramasını terk etmenin mümkün olup olmadığını tartışan "Büyük Usta Düzeyinde Arama Olmadan Satranç" adlı bir makale yayınladı. Otonom sürüşe benzer şekilde, doğrudan eylemlerin çıktısını almak için yalnızca bir ağ kullanılırken sonraki tüm adımlar göz ardı edilir.
Makale, önemli miktarda veri ve model parametresine rağmen, arama yapılmadan oldukça makul sonuçların elde edilebileceği sonucuna varıyor. Ancak aramayı kullanan yöntemlere göre önemli farklılıklar vardır. Bu özellikle bazı karmaşık oyunsonlarıyla başa çıkmak için kullanışlıdır.
Çok adımlı oyunlar gerektiren karmaşık senaryolar veya köşe vakaları için bu benzetme, geleneksel optimizasyon veya arama algoritmalarından tamamen vazgeçmeyi hâlâ zorlaştırıyor. AlphaZero gibi çeşitli teknolojilerin avantajlarından makul şekilde yararlanmak, performansı artırmanın en iyi yoludur.
6.Geleneksel yöntem = kurala dayalı değilse?
Birçok insanla konuşurken bu kavramı defalarca düzeltmek zorunda kaldım. Pek çok kişi tamamen veriye dayalı olmadığı sürece kurala dayalı olmadığına inanıyor. Örneğin satrançta formülleri ve satranç kayıtlarını ezberleyerek ezberlemek kurala dayalıdır ancak AlphaGo ve AlphaZero gibi modele optimizasyon ve arama yoluyla rasyonel olma yeteneği kazandırır. Buna kural tabanlı denilebileceğini düşünmüyorum.
Bu nedenle büyük modelin kendisi şu anda eksik ve araştırmacılar CoT gibi yöntemlerle öğrenme odaklı bir model sağlamaya çalışıyor. Bununla birlikte, salt veriye dayalı görüntü tanıma ve açıklanamayan nedenler gerektiren görevlerden farklı olarak, araba kullanan bir kişinin her eyleminin açık bir itici gücü vardır.
Uygun algoritma mimarisi tasarımı altında, karar yörüngesi, farklı durumları düzeltmek için zorla yama yapmak ve parametreleri ayarlamak yerine, değişken hale gelmeli ve bilimsel hedeflerin rehberliğinde eşit şekilde optimize edilmelidir. Böyle bir sistem doğal olarak her türlü sabit kodlanmış tuhaf kurallara sahip değildir.
Çözüm
Kısacası uçtan uca umut verici bir teknik rota olabilir ancak konseptin nasıl uygulandığı daha fazla araştırma gerektirir. Bir dizi veri ve model parametresinin tek doğru çözüm olmadığını düşünüyorum ve eğer diğerlerini aşmak istiyorsak, çok çalışmaya devam etmeliyiz.
Gönderim zamanı: Nis-24-2024