Sistemas de condución autónoma de extremo a extremo: Driving the Future

Condución autónoma de extremo a extremo

Como definir un sistema de condución autónoma de extremo a extremo?

A definición máis común é que un sistema "de extremo a extremo" é un sistema que introduce información bruta do sensor e emite directamente as variables de interese para a tarefa. Por exemplo, no recoñecemento de imaxes, a CNN pódese chamar "de extremo a extremo" en comparación co método tradicional de función + clasificador.

 

Nas tarefas de condución autónoma, introdúcense os datos de varios sensores (como cámaras, LiDAR, Radar ou IMU...) e saen directamente os sinais de control do vehículo (como o ángulo do acelerador ou o volante). Para considerar os problemas de adaptación dos diferentes modelos de vehículos, a saída tamén se pode relaxar á traxectoria de condución do vehículo.

 

Partindo desta base, tamén xurdiron conceptos modulares de extremo a extremo, como UniAD, que melloran o rendemento introducindo a supervisión de tarefas intermedias relevantes, ademais dos sinais ou puntos de paso finais de control de saída. Non obstante, a partir dunha definición tan estreita, a esencia do extremo a extremo debería ser a transmisión sen perdas de información sensorial.

 

Revisemos primeiro as interfaces entre os módulos de detección e PnC en sistemas non end-to-end. Normalmente, detectamos obxectos incluídos na lista branca (como coches, persoas, etc.) e analizamos e predicimos as súas propiedades. Tamén coñecemos o ambiente estático (como a estrutura da estrada, os límites de velocidade, os semáforos, etc.). Se fosemos máis detallados, tamén detectariamos obstáculos universais. En resumo, a información emitida por estas percepcións constitúe un modelo de visualización de escenas complexas de condución.

 

Non obstante, para algunhas escenas moi obvias, a abstracción explícita actual non pode describir completamente os factores que afectan o comportamento da condución na escena, ou as tarefas que debemos definir son demasiado triviais, e é difícil enumerar todas as tarefas necesarias. Polo tanto, os sistemas de extremo a extremo proporcionan unha representación completa (quizais implícita) coa esperanza de actuar de forma automática e sen perdas sobre as PnC con esta información. Na miña opinión, todos os sistemas que poden cumprir este requisito poden chamarse de extremo a extremo xeneralizados.

 

En canto a outras cuestións, como algunhas optimizacións de escenarios de interacción dinámica, creo que polo menos non só un extremo a extremo pode resolver estes problemas, e que o extremo a extremo pode non ser a mellor solución. Os métodos tradicionais poden resolver estes problemas e, por suposto, cando a cantidade de datos é suficientemente grande, un extremo a extremo pode proporcionar unha mellor solución.

Algúns malentendidos sobre a condución autónoma de extremo a extremo

1. Os sinais de control e os waypoints deben emitirse para que sexan de extremo a extremo.

Se estás de acordo co concepto amplo de extremo a extremo discutido anteriormente, entón este problema é fácil de entender. De extremo a extremo debería enfatizar a transmisión sen perdas de información en lugar de emitir directamente o volume da tarefa. Un enfoque estreito de extremo a extremo causará moitos problemas innecesarios e requirirá moitas solucións encubertas para garantir a seguridade.

2.O sistema de extremo a extremo debe basearse en modelos grandes ou visión pura.

Non existe unha conexión necesaria entre a condución autónoma de extremo a extremo, a condución autónoma de grandes modelos e a condución autónoma puramente visual porque son conceptos completamente independentes; un sistema de extremo a extremo non está necesariamente impulsado por grandes modelos, nin necesariamente está impulsado pola visión pura. de.

Sistema de investigación e desenvolvemento de condución autónoma de extremo a extremo

3.A longo prazo, é posible que o mencionado sistema de extremo a extremo en sentido estricto consiga unha condución autónoma por riba do nivel L3?

 

O rendemento do que actualmente se denomina FSD de extremo a extremo puro está lonxe de ser suficiente para cumprir coa fiabilidade e estabilidade requiridas no nivel L3. Para dicilo máis claramente, se o sistema de condución autónoma quere ser aceptado polo público, a clave é se o público pode aceptar que, nalgúns casos, a máquina comete erros e os humanos poden resolvelos facilmente. Isto é máis difícil para un sistema puro de extremo a extremo.

 

Por exemplo, tanto Waymo como Cruise en Norteamérica tiveron moitos accidentes. Non obstante, o último accidente de Cruise provocou dúas feridas, aínda que tales accidentes son bastante inevitables e aceptables para os condutores humanos. Non obstante, tras este accidente, o sistema valorou mal a localización do accidente e a localización dos feridos e descendeu ao modo pull-over, o que provocou que os feridos fosen arrastrados durante moito tempo. Este comportamento é inaceptable para calquera condutor humano normal. Non se fará, e os resultados serán moi malos.

 

Ademais, trátase dunha chamada de atención que debemos considerar detidamente como evitar esta situación durante o desenvolvemento e funcionamento dos sistemas de condución autónoma.

4.Entón, neste momento, cales son as solucións prácticas para a próxima xeración de sistemas de condución asistida producidos en masa?

 

Segundo o meu entendemento actual, cando se utiliza o chamado modelo de extremo a extremo na condución, despois de emitir a traxectoria, devolverá unha solución baseada nos métodos tradicionais. Alternativamente, os planificadores baseados na aprendizaxe e os algoritmos tradicionais de planificación de traxectorias emiten varias traxectorias simultáneamente e despois seleccionan unha traxectoria a través dun selector.

 

Este tipo de solución e elección encubertas limita o límite superior do rendemento deste sistema en cascada se se adopta esta arquitectura do sistema. Se este método aínda se basea na aprendizaxe de retroalimentación pura, produciranse fallos imprevisibles e non se conseguirá en absoluto o obxectivo de estar seguro.

 

Se consideramos re-optimizar ou seleccionar utilizando métodos de planificación tradicionais nesta traxectoria de saída, isto é equivalente á traxectoria producida polo método de aprendizaxe; xa que logo, por que non optimizamos e buscamos directamente esta traxectoria?

 

Por suposto, algunhas persoas dirían que tal problema de optimización ou busca non é convexo, ten un gran espazo de estado e é imposible executalo en tempo real nun sistema no vehículo. Pídolle a todos que consideren coidadosamente esta pregunta: nos últimos dez anos, o sistema de percepción recibiu polo menos cen veces o dividendo da potencia de cálculo, pero que pasa co noso módulo PnC?

 

Se ademais permitimos que o módulo PnC utilice unha gran potencia de cálculo, combinada con algúns avances en algoritmos de optimización avanzados nos últimos anos, aínda é correcta esta conclusión? Para este tipo de problemas, debemos considerar o que é correcto desde os primeiros principios.

5.Como conciliar a relación entre os métodos baseados en datos e os tradicionais?

 

Xogar ao xadrez é un exemplo moi parecido á condución autónoma. En febreiro deste ano, Deepmind publicou un artigo chamado "Grandmaster-Level Chess Without Search", discutindo se é factible usar só os datos e abandonar a busca MCTS en AlphaGo e AlphaZero. Do mesmo xeito que a condución autónoma, só se utiliza unha rede para emitir accións directamente, mentres que se ignoran todos os pasos posteriores.

 

O artigo conclúe que, a pesar da cantidade considerable de datos e parámetros do modelo, pódense obter resultados bastante razoables sen utilizar unha busca. Non obstante, hai diferenzas significativas en comparación cos métodos que usan a busca. Isto é especialmente útil para tratar con algúns xogos finais complexos.

 

Para escenarios complexos ou casos de esquina que requiren xogos de varios pasos, esta analoxía aínda dificulta abandonar completamente os algoritmos tradicionais de optimización ou busca. Utilizar razoablemente as vantaxes de varias tecnoloxías como AlphaZero é a mellor forma de mellorar o rendemento.

Control de vehículos

6.Método tradicional = baseado en regras se outra cousa?

 

Tiven que corrixir este concepto unha e outra vez mentres falaba con moita xente. Moitas persoas cren que, mentres non se basee exclusivamente en datos, non se basea en regras. Por exemplo, no xadrez, a memorización de fórmulas e rexistros de xadrez de memoria baséase en regras, pero como AlphaGo e AlphaZero, dálle ao modelo a capacidade de ser racional mediante a optimización e a busca. Non creo que se lle poida chamar baseado en regras.

 

Debido a isto, actualmente falta o modelo grande en si, e os investigadores están tentando proporcionar un modelo orientado á aprendizaxe a través de métodos como o CoT. Non obstante, a diferenza das tarefas que requiren un recoñecemento de imaxes baseado en datos puros e razóns inexplicables, cada acción dunha persoa que conduce ten unha forza motriz clara.

 

Baixo o deseño da arquitectura de algoritmos apropiado, a traxectoria de decisión debería facerse variable e optimizarse uniformemente baixo a orientación de obxectivos científicos, en lugar de parchear e axustar os parámetros forzosamente para corrixir diferentes casos. Tal sistema, naturalmente, non ten todo tipo de regras estrañas codificadas.

Conclusión

En resumo, de punta a punta pode ser unha vía técnica prometedora, pero como se aplica o concepto require máis investigación. Creo que unha morea de datos e parámetros do modelo non é a única solución correcta, e se queremos superar a outros, temos que seguir traballando moito.


Hora de publicación: 24-Abr-2024