Introducción a los conocimientos básicos de la tecnología de conducción autónoma

Un vehículo autónomo es un vehículo que es capaz de detectar su entorno y navegar sin intervención humana. Utiliza una variedad de tecnologías que incluyen radar, láser, ultrasonido, GPS, odómetro, visión por computadora y más para detectar el entorno que lo rodea. A través de sistemas informáticos y de control avanzados, puede identificar obstáculos y diversas señales, y planificar caminos adecuados para controlar la conducción del vehículo.

La Sociedad de Ingenieros de Automoción (SAE) divide la conducción autónoma en 6 niveles: 0~5 ***.

Nivel 0: Sin automatización.

Sin ninguna característica o tecnología de conducción autónoma, el conductor humano tiene control absoluto sobre todas las funciones del coche. El conductor es responsable de conducir, acelerar, frenar y observar las condiciones de la carretera. Cualquier tecnología de asistencia al conductor, como la advertencia de colisión frontal existente, la advertencia de cambio de carril, los limpiaparabrisas automáticos y el control automático de los faros. Aunque es inteligente, todavía requiere que una persona controle el vehículo, por lo que todavía pertenece al nivel 0.

Nivel 1: Asistencia a la conducción.

El conductor sigue siendo responsable de la seguridad en la conducción, pero se puede delegar parte del control a los administradores del sistema y algunas funciones se pueden realizar automáticamente, como el control de crucero adaptativo (ACC), la asistencia de frenado de emergencia (EBA) y el mantenimiento de carril. soporte (LKS). El nivel 1 se caracteriza por una única función y el conductor no puede controlar sus manos y pies al mismo tiempo.

Nivel 2: Automatización Parcial

El conductor humano y el coche comparten el control. El conductor no puede operar el automóvil bajo algunas circunstancias preestablecidas, es decir, sus manos y pies abandonan el control al mismo tiempo, pero el conductor aún debe estar disponible en todo momento, ser responsable de la seguridad en la conducción y estar preparado para hacerse cargo de los derechos de conducción en poco tiempo. Por ejemplo, combina la función de seguimiento del vehículo formada por ACC y LKS. El núcleo del Nivel 2 es no tener más de dos funciones, pero el conductor ya no puede ser el operador principal.

Nivel 3: Automatización condicional.

El control automático se puede lograr en circunstancias limitadas, como en tramos de carretera preestablecidos (como autopistas y tramos urbanos menos congestionados). La conducción autónoma puede ser totalmente responsable del control de todo el vehículo, pero en caso de emergencia, el conductor aún debe tomar el control del automóvil en un momento determinado, pero con suficiente tiempo de advertencia, como por ejemplo, si hay obras en la carretera por delante. El nivel 3 liberará a los conductores, lo que significa que ya no serán responsables de la seguridad en la conducción ni de controlar las condiciones de la carretera.

Nivel 4: Alto grado de automatización

La conducción autónoma puede estar altamente automatizada en determinadas condiciones de la carretera, como parques cerrados, autopistas, vías urbanas o rutas de conducción fijas. En estas condiciones limitadas, un conductor humano puede hacerlo sin intervención.

Nivel 5: Automatización completa.

No hay restricciones en el entorno de conducción. Puede hacer frente automáticamente a diversas condiciones de tráfico y entornos de carretera complejos, y conducir desde el punto de partida hasta el destino sin asistencia. Sólo requiere información sobre el punto de partida y el punto de llegada. El coche siempre será responsable de la seguridad en la conducción, con total independencia de la intervención del conductor y sin restricciones por carreteras específicas.

Nota: DDT (tarea de conducción dinámica): la tarea de conducción dinámica se refiere a todas las operaciones en tiempo real y funciones estratégicas necesarias para que un automóvil conduzca en la carretera, excluidas funciones estratégicas como la programación, el destino y la ruta. selección, etc

El núcleo del sistema de conducción no tripulado se puede resumir en tres partes: percepción, planificación y control. El siguiente diagrama muestra la interacción de estos componentes y su interacción con el hardware del vehículo y otros vehículos:

La percepción se refiere a la capacidad de un sistema autónomo para recopilar información del entorno y extraer conocimiento relevante de él. Entre ellos, la conciencia ambiental se refiere a la capacidad de comprender el entorno, como la ubicación de obstáculos, la detección de señales de tráfico, la detección de peatones y vehículos y la clasificación semántica de otros datos. En términos generales, el posicionamiento también forma parte de la percepción. El posicionamiento es la capacidad de un vehículo autónomo de determinar su posición en relación con el entorno.

Para garantizar que los vehículos no tripulados puedan comprender y captar el entorno, la parte de percepción del entorno del sistema de conducción no tripulado normalmente necesita obtener una gran cantidad de información sobre el entorno circundante, que incluye: la ubicación, la velocidad y posible comportamiento de los obstáculos, así como la zona de conducción, las normas de tráfico, etc. Los vehículos no tripulados suelen obtener esta información fusionando datos de varios sensores como lidar, cámaras y radares de ondas milimétricas.

Los sensores de radar para vehículos tienen diferentes funciones, ventajas y desventajas, y las comparaciones relevantes se muestran en la siguiente tabla:

Lidar es un dispositivo que utiliza luz láser para detectar y medir distancias.

Puede enviar millones de pulsos de luz al medio ambiente cada segundo, y en su interior hay una estructura giratoria que permite al lidar construir un mapa tridimensional del entorno circundante en tiempo real.

En términos generales, LIDAR escanea el entorno circundante a una velocidad de aproximadamente 10 Hz. El resultado de un escaneo es un mapa tridimensional compuesto de puntos densos, cada punto tiene información (x, y, z). Esta imagen se llama imagen de nube de puntos. Como se muestra en la siguiente figura, se trata de un mapa de nube de puntos establecido por el lidar Velodyne VLP-32c:

Debido a su confiabilidad, el lidar sigue siendo el sensor más importante en los sistemas de conducción no tripulados. Pero en el uso real, LIDAR no es perfecto. La nube de puntos suele ser demasiado escasa e incluso se pierden algunos puntos. Lidar tiene dificultad para identificar patrones en superficies de objetos irregulares. Otro gran desafío es que el alcance de detección del lidar es relativamente corto, con un alcance de detección promedio de aproximadamente 150 m, dependiendo del entorno y los obstáculos. LiDAR también es muy inferior a las cámaras en resolución angular. LiDAR también es sensible al medio ambiente. Por ejemplo, en días de lluvia, el agua salpicada por los vehículos provocará ruido en el lidar.

El radar de ondas milimétricas detecta la presencia, distancia, velocidad y orientación de los objetivos emitiendo ondas electromagnéticas y detectando ecos. El radar de ondas milimétricas se ha convertido en una parte importante de los equipos de detección debido a su tecnología relativamente madura, su bajo costo y su buen rendimiento en condiciones climáticas adversas. Sin embargo, debido a su baja resolución, no se puede utilizar como sustituto del lidar, pero es un dispositivo complementario importante para el lidar.

Existen cuatro tipos de cámaras dependiendo del objetivo y disposición: cámara monocular, cámara binocular, cámara binocular y cámara panorámica.

El módulo de cámara monocular solo contiene una cámara y una lente. Debido a que muchos estudios sobre algoritmos de imágenes se basan en cámaras monoculares, la madurez del algoritmo de las cámaras monoculares es mayor que la de otros tipos de cámaras. Pero un ojo tiene dos defectos de nacimiento. En primer lugar, su campo de visión depende totalmente de la lente. Los objetivos con distancias focales cortas tienen un campo de visión amplio pero carecen de información sobre la distancia. O viceversa, Dallas al auditorio. Por eso, las cámaras monoculares suelen elegir lentes con distancias focales moderadas. En segundo lugar, la precisión de la distancia de visión única es baja. La imagen de la cámara es una vista en perspectiva, es decir, cuanto más lejos está el objeto, más pequeña es la imagen. Los objetos cercanos requieren cientos o incluso miles de píxeles para ser descritos; el mismo objeto en la distancia puede que sólo necesite unos pocos píxeles para describirlo. Esta característica hará que cuanto más lejos estén los píxeles, mayor será la distancia representada, por lo que para un solo ojo, cuanto más lejos esté el objeto, menor será la precisión del alcance.

Debido a la deficiencia de una única distancia de visión, surgieron las cámaras binoculares. Cuando dos cámaras cercanas entre sí capturan un objeto, se obtendrá el desplazamiento de píxeles del mismo objeto en el plano de imagen de la cámara. Utilizando información como el desplazamiento de píxeles, la distancia focal de la cámara y la distancia real entre las dos cámaras, se puede obtener la distancia del objeto mediante conversión matemática. Aunque los binoculares pueden obtener resultados de alcance de alta precisión y proporcionar capacidades de segmentación de imágenes, como los monoculares, el campo de visión de la lente depende completamente de la lente. Además, el principio de medición de distancia binocular tiene muchos requisitos en cuanto a la posición de instalación y la distancia de las dos lentes, lo que causará problemas en la calibración de la cámara.

Las cámaras de tres ojos tienen ciertas deficiencias independientemente de si son monoculares o binoculares, por lo que la solución de cámara más utilizada en la conducción sin conductor es la cámara de tres ojos. Una cámara monocular es en realidad una combinación de tres cámaras monoculares con diferentes distancias focales. Cada cámara tiene un rango de percepción diferente según la distancia focal. En el caso de las cámaras, el alcance percibido pierde campo de visión o distancia. Una cámara de tres lentes puede compensar el problema del rango de percepción. Por tanto, es muy utilizado en la industria. Es precisamente porque el campo de visión de cada cámara de la cámara de tres ojos es diferente, por lo que el rango cercano se asigna a la cámara de campo amplio, el rango medio se asigna a la cámara de campo principal y el rango lejano El rango se otorga a la cámara de campo de visión estrecho. De esta forma cada cámara podrá sacarle el máximo partido. La desventaja de las cámaras de tres propósitos es que necesitan calibrar tres cámaras al mismo tiempo, por lo que la carga de trabajo es relativamente grande. En segundo lugar, la parte del software necesita correlacionar los datos de las tres cámaras y los requisitos para el algoritmo también son muy altos.

En cuanto a la cámara de visión envolvente, las lentes de las tres cámaras mencionadas anteriormente no son ojo de pez. La lente de la cámara de visión envolvente es una lente ojo de pez y está instalada mirando hacia el suelo. Algunos modelos de gama alta tendrán una función de "pantalla panorámica de 360°" mediante cámaras panorámicas. Cuatro lentes de ojo de pez instaladas delante del vehículo, debajo de los espejos retrovisores izquierdo y derecho del vehículo y detrás del vehículo recopilan imágenes. Para obtener un campo de visión lo suficientemente grande, las lentes ojo de pez producirán una distorsión grave de la imagen. La cámara panorámica tiene un rango de detección pequeño y se utiliza principalmente para la detección de obstáculos dentro de un rango de 5 a 10 metros de la carrocería del automóvil, identificación de líneas de garaje al estacionar de forma independiente, etc.

Para comprender la información de la nube de puntos, en términos generales, realizamos dos operaciones sobre los datos de la nube de puntos: segmentación y clasificación. Entre ellos, la segmentación consiste en agrupar puntos discretos en el mapa de la nube de puntos en varios enteros, mientras que la clasificación consiste en distinguir a qué categoría pertenecen estos todos (como peatones, vehículos, obstáculos). Los algoritmos de segmentación se pueden dividir en las siguientes categorías:

Una vez completada la segmentación del objetivo de la nube de puntos, los objetivos segmentados deben clasificarse correctamente. En este enlace, los algoritmos de clasificación en el aprendizaje automático, como las máquinas de vectores de soporte (SVM), se utilizan generalmente para clasificar características agrupadas. En los últimos años, debido al desarrollo del aprendizaje profundo, la industria ha comenzado a utilizar redes neuronales convolucionales (CNN) especialmente diseñadas para clasificar grupos de nubes de puntos 3D.

En aplicaciones prácticas, ya sea el método de extracción de características (SVM) o el método de nube de puntos original (CNN), debido a la baja resolución de la propia nube de puntos lidar, la clasificación basada en nubes de puntos no es adecuada. para puntos de reflexión. Los objetivos dispersos (como peatones) no son confiables. Por lo tanto, en aplicaciones prácticas, a menudo integramos sensores de radar y cámara, utilizamos la alta resolución de la cámara para clasificar objetivos y utilizamos la confiabilidad del lidar para detectar y medir obstáculos, combinando las ventajas de ambos.

En los sistemas sin conductor, normalmente utilizamos la visión de imágenes para detectar carreteras y objetivos en las carreteras. La detección de carreteras incluye detección de carriles y detección de áreas transitables. La detección de señales de tráfico incluye la detección y clasificación de todos los participantes del tráfico, como detección de vehículos, detección de peatones, detección de señales de tráfico, etc.

La detección de líneas de carril implica dos aspectos: el primero es identificar las líneas de carril curvas, la curvatura se puede calcular; el segundo es determinar la desviación del propio vehículo con respecto al; líneas de carril (es decir, la posición del propio vehículo no tripulado en la línea de carril). Un método consiste en extraer algunas características del carril, incluidas características de borde (generalmente gradientes, como los operadores de Sobel), características de color de las líneas del carril, etc. , y utiliza un polinomio para ajustar los píxeles que creemos que pueden ser líneas de carril, y luego determina la curvatura de la línea del carril adelante y la desviación del vehículo del carril según el polinomio y la posición actual de la cámara montada en el vehículo.

Actualmente, una forma de detectar áreas de conducción es utilizar redes neuronales profundas para segmentar directamente la escena, es decir, entrenando una red neuronal profunda píxel por píxel para cortar las áreas de conducción en la imagen.

En la actualidad, la detección y clasificación de los participantes del tráfico se basa principalmente en modelos de aprendizaje profundo. Hay dos modelos comúnmente utilizados:

La capa de sensor envía datos cuadro por cuadro a una frecuencia fija. al downstream, pero el downstream no puede tomar decisiones y no puede integrarse con los datos de cada cuadro. Debido a que el estado del sensor no es 100% efectivo, es extremadamente irresponsable que las decisiones posteriores solo juzguen si hay un obstáculo más adelante en función de la señal de un determinado cuadro (el sensor puede haberlo detectado por error). Por lo tanto, el flujo ascendente necesita preprocesar la información para garantizar que los obstáculos delante del vehículo siempre existan en la dimensión del tiempo, en lugar de pasar en un instante.

Aquí se utilizará un algoritmo utilizado a menudo en el campo de la conducción inteligente: el filtro de Kalman.

El filtro de Kalman es un filtro recursivo eficiente (filtro autorregresivo) que puede estimar el estado de un sistema dinámico a partir de una serie de mediciones incompletas y ruidosas. El filtro de Kalman considera la distribución conjunta en diferentes momentos en función de los valores de cada medición en diferentes momentos, y luego genera una estimación de la variable desconocida, por lo que es más preciso que un método de estimación basado solo en una única medición.

El filtro de Kalman tiene muchas aplicaciones en tecnología. Los más comunes son la guía, navegación y control de aeronaves y naves espaciales. El filtro de Kalman también se utiliza ampliamente en el análisis de series temporales, como el procesamiento de señales y la econometría. El filtrado de Kalman también es uno de los temas importantes en la planificación y el control del movimiento de los robots y, en ocasiones, se incluye en la optimización de la trayectoria. El filtro de Kalman también se utiliza para modelar el control del movimiento en el sistema nervioso central. Debido a que existe una diferencia de tiempo entre dar instrucciones de movimiento y recibir retroalimentación de los nervios sensoriales, el uso del filtro de Kalman ayuda a establecer un sistema práctico para estimar el estado actual del sistema de movimiento y actualizar las instrucciones.

La fusión de información se refiere a la operación todo en uno de información con los mismos atributos.

Por ejemplo, si la cámara detecta un obstáculo delante del vehículo, la onda milimétrica también detecta un obstáculo delante del vehículo, y el lidar también detecta un obstáculo delante del vehículo, pero en De hecho, solo hay un obstáculo al frente, entonces necesitamos. Lo que hace es fusionar la información de este vehículo de múltiples sensores y decirle a los de abajo que hay un vehículo adelante, en lugar de tres vehículos.

La transformación coordinada es muy importante en el campo de la conducción autónoma.

Los sensores están instalados en diferentes lugares, como el radar ultrasónico (si hay un obstáculo en el lado derecho del vehículo, a 3 metros del radar ultrasónico, entonces ¿creemos que el obstáculo está a 3 metros? desde el vehículo No necesariamente, debido al control de la toma de decisiones Cuando se lleva a cabo la capa de planificación del movimiento del vehículo, se completa en el sistema de coordenadas de la carrocería (el sistema de coordenadas de la carrocería, generalmente el centro del eje de la rueda trasera es el punto O), por lo tanto, toda la información del sensor debe transferirse al sistema de coordenadas del vehículo. Por lo tanto, la capa de percepción después de obtener la información de posición del obstáculo de 3 m, la información de posición del obstáculo en este capítulo debe transferirse al sistema de coordenadas del vehículo, que se puede utilizar para la planificación. y toma de decisiones, la cámara generalmente se instala debajo del parabrisas y los datos obtenidos también se basan en el sistema de coordenadas de la cámara. Para los datos posteriores, también es necesario convertirlos al sistema de coordenadas del vehículo. p> A nivel de percepción de los vehículos no tripulados, la importancia del posicionamiento es evidente. Los vehículos no tripulados necesitan conocer su posición exacta en relación con el entorno. El error de posicionamiento aquí no puede exceder los 10 cm. El vehículo mide 30 cm, entonces este será un vehículo no tripulado muy peligroso (tanto para peatones como para pasajeros), porque las capas de planificación y ejecución del vehículo no tripulado no saben que tiene un error de 30 centímetros y aún así lo siguen. Se puede ver que los vehículos no tripulados necesitan un posicionamiento de alta precisión.

El método de posicionamiento más utilizado para vehículos no tripulados es la fusión de sistemas de posicionamiento global (GPS) y de navegación inercial, donde la precisión del posicionamiento de. El GPS mide entre decenas de metros y unos pocos centímetros. Los sensores GPS de alta precisión son relativamente caros y el método de posicionamiento basado en GPS/IMU no es adecuado para situaciones en las que la señal GPS falta y es débil. estacionamientos y áreas urbanas rodeadas de edificios de gran altura, no se puede lograr un posicionamiento de alta precisión y solo se puede aplicar a tareas no tripuladas en algunos escenarios.

El algoritmo de posicionamiento asistido por mapas es otro método no tripulado. El algoritmo de posicionamiento del vehículo. La localización y creación simultánea de mapas (SLAM) es un representante de este tipo de algoritmo. El objetivo de SLAM es utilizar este mapa para determinar la posición actual del vehículo utilizando las características del entorno observado y las características observadas actualmente. El proceso de estimación de la posición actual mediante observaciones anteriores y actuales. En la práctica, generalmente utilizamos el filtrado bayesiano, incluido el filtrado de Kalman, el filtrado de Kalman extendido y el filtrado de partículas. SLAM en el desarrollo real de vehículos no tripulados A diferencia de los robots, el movimiento de los vehículos no tripulados es de larga distancia y abierto. A medida que aumenta la distancia, la desviación del posicionamiento de SLAM aumentará gradualmente, lo que provocará fallas de posicionamiento. En la práctica, un método eficaz para posicionar vehículos no tripulados es cambiar el algoritmo de coincidencia de escaneo en el SLAM original. Ya no realizamos mapas durante el posicionamiento, sino que utilizamos lidar y otros sensores para construir un mapa de nube de puntos del área con anticipación y agregarlo. alguna "semántica" al mapa a través de programas y procesamiento manual (como etiquetado específico de líneas de carril, ubicación de la red de carreteras, semáforos, normas de tráfico del tramo de carretera actual, etc. ). Este mapa semántico es la altura de nuestro vehículo no tripulado. En el posicionamiento real, utilizamos el escaneo LIDAR actual y nubes de puntos de coincidencia de mapas prediseñados de alta precisión para determinar la ubicación específica de nuestro vehículo no tripulado en el mapa. Este tipo de método se denomina colectivamente coincidencia de escaneo. El método de coincidencia de escaneo más común es el método iterativo del punto más cercano (ICP), que completa el registro de la nube de puntos en función de la medición de la distancia entre el escaneo actual y el escaneo de destino.

Además, la transformación de distribución normal también es un método de registro de nubes de puntos comúnmente utilizado, que se basa en el histograma característico de las nubes de puntos. Los métodos de posicionamiento basados ​​en el registro de nubes de puntos también pueden lograr una precisión de posicionamiento dentro de los 10 cm. Aunque el registro de nubes de puntos puede proporcionar el posicionamiento global de vehículos no tripulados en relación con el mapa, este método depende demasiado de mapas prediseñados de alta precisión y aún debe usarse junto con el posicionamiento GPS en carreteras abiertas. En tramos de carretera con escenas relativamente simples (como autopistas), el costo de usar GPS para agregar coincidencias de nubes de puntos es relativamente alto.

Lectura ampliada: Retos y soluciones del sistema de percepción en piloto automático L4

Un breve análisis de una parte importante de la conducción autónoma: el estado de desarrollo y dirección del sistema de percepción

El módulo de planificación de vehículos no tripulados se divide en tres capas: planificación de tareas, planificación de comportamiento y planificación de acciones. Entre ellos, la planificación de tareas a menudo se denomina planificación de rutas o planificación de rutas y es responsable de la planificación de rutas de nivel superior, como la selección de rutas desde el punto de partida hasta el punto final.

Podemos pensar en nuestro sistema de carreteras actual como una red de gráficos dirigidos, que puede representar las conexiones entre carreteras, las reglas de tráfico, el ancho de la carretera y otra información. Es esencialmente la parte "semántica" del mapa de alta precisión que mencionamos en el posicionamiento. sección anterior. Este gráfico dirigido se denomina gráfico de red de rutas, como se muestra en la siguiente figura:

Cada borde dirigido en dicho gráfico de red de carreteras está ponderado, por lo que el problema de planificación de rutas de los vehículos no tripulados se convierte en el proceso de seleccionar la ruta óptima (es decir, pérdida mínima) basándose en un determinado método para que el vehículo llegue a un determinado destino (normalmente de A a B) en el gráfico de la red de carreteras, y luego el problema se convierte en un problema de búsqueda de gráfico dirigido. Algoritmos tradicionales como el algoritmo de Dijkstra.

A los planificadores del comportamiento a veces se les llama tomadores de decisiones. Su tarea principal es tomar la siguiente decisión que debe realizar el vehículo no tripulado en función de los objetivos de planificación de la misión y la situación local actual (la ubicación y el comportamiento de otros vehículos y peatones, las normas de tráfico vigentes, etc.). ). Esta capa puede entenderse como el copiloto del vehículo. Dependiendo del objetivo y de las condiciones actuales del tráfico, indica al conductor si debe seguir o adelantar, detenerse y esperar a que los peatones pasen o rodearlos, etc.

Un enfoque para la planificación del comportamiento es utilizar máquinas de estados finitos (FSM) complejas que contienen una gran cantidad de frases de acción. A partir de un estado básico, FSM saltará a diferentes estados de acción según los diferentes escenarios de conducción y pasará las frases de acción a la capa inferior de planificación de acciones. La siguiente imagen es una máquina de estados finitos simple:

Como se muestra en la imagen de arriba, cada estado es una decisión sobre la acción del vehículo. Existen ciertas condiciones de salto entre estados, y algunos estados pueden realizar un ciclo automático (. como el estado de seguimiento y el estado de espera en la figura anterior). Aunque es el método principal de toma de decisiones de comportamiento utilizado actualmente por los vehículos no tripulados, las máquinas de estados finitos todavía tienen grandes limitaciones: en primer lugar, para lograr decisiones de comportamiento complejas, es necesario diseñar manualmente una gran cantidad de estados en los que el vehículo puede caer; eso no es considerado por el estado de la máquina de estados finitos si la máquina de estados finitos no está diseñada con protección de punto muerto, el vehículo puede incluso caer en algún tipo de punto muerto.

El proceso de planificar una serie de acciones para lograr un determinado propósito (como evitar obstáculos) se denomina planificación de acciones. En términos generales, se suelen utilizar dos indicadores para considerar el desempeño de un algoritmo de planificación de acciones: eficiencia computacional e integridad. La llamada eficiencia computacional se refiere a la eficiencia de procesamiento para completar una planificación de acciones. La eficiencia computacional de un algoritmo de planificación de acciones depende en gran medida del espacio de configuración. Se dice que un algoritmo de planificación de acciones es completo si puede devolver una solución en un tiempo finito cuando hay una solución al problema y no devolver ninguna solución cuando no hay solución.

Espacio de configuración: Define el conjunto de todas las configuraciones posibles del robot. Define las dimensiones en las que el robot puede moverse. El problema discreto bidimensional más simple, entonces el espacio de configuración es [x, y]. El espacio de configuración de un vehículo no tripulado puede ser muy complejo, dependiendo del algoritmo de planificación de movimiento utilizado.

Después de introducir el concepto de espacio de configuración, la planificación de acciones de los vehículos no tripulados se convierte en: dada una configuración inicial, una configuración objetivo y varias restricciones, encontrar una serie de acciones en el espacio de configuración para lograr la configuración objetivo. el resultado de la ejecución de estas acciones es transferir el vehículo no tripulado de la configuración inicial a la configuración objetivo mientras se satisfacen las restricciones. En el escenario de aplicación de vehículos no tripulados, la configuración inicial suele ser el estado actual (posición actual, velocidad y velocidad angular, etc.) del vehículo no tripulado, mientras que la configuración objetivo proviene de la planificación de acciones de nivel superior y la restricción es el límite de movimiento del vehículo (amplitud de ángulo máximo, aceleración máxima, etc.) Obviamente, la cantidad de cálculo de la planificación de acciones en un espacio de configuración de alta dimensión es muy grande. Para garantizar la integridad del algoritmo de planificación, tenemos que buscar casi todos los caminos posibles, lo que forma el problema de la "maldición de la dimensionalidad" en la planificación de acciones continuas. La idea central para resolver este problema en la planificación de acciones actual es convertir el modelo espacial continuo en un modelo discreto. Los métodos específicos se pueden resumir en dos categorías: planificación combinada y planificación basada en muestreo.

Los métodos combinatorios de planificación del movimiento encuentran caminos a través de un espacio de configuración continuo sin utilizar aproximaciones. Debido a esta propiedad, se les puede llamar algoritmos exactos. Los métodos combinatorios encuentran soluciones completas mediante la construcción de representaciones discretas de problemas de planificación. Por ejemplo, en el Darpa Urban Challenge, el vehículo autónomo BOSS de CMU utilizó algoritmos de planificación de acciones. Primero utilizan un planificador de rutas para generar rutas alternativas y puntos objetivo (que se pueden lograr integrando dinámicas) y luego seleccionan la ruta óptima mediante un algoritmo de optimización. Otro método de discretización es el método de descomposición en malla. Después de cuadricular el espacio de configuración, normalmente podemos encontrar una ruta de optimización utilizando un algoritmo de búsqueda de gráficos discretos como A*.

Los métodos basados ​​en muestreo se utilizan ampliamente debido a su exhaustividad probabilística. Los algoritmos más comunes son PRM (Probabilistic Roadmap), RRT (Rapid Random Tree) y FMT (Fast Marching Tree). En la aplicación de vehículos no tripulados, el método de muestreo de estado debe considerar las restricciones de control de los dos estados y también necesita un método que pueda consultar de manera efectiva si el estado de muestreo y el estado principal son accesibles.

La tecnología de control de vehículos para vehículos autónomos tiene como objetivo planificar trayectorias objetivo basándose en la toma de decisiones basada en tecnología de conciencia ambiental. Mediante la cooperación de los sistemas de control longitudinal y lateral, el automóvil puede seguir de manera precisa y estable la trayectoria objetivo. Al mismo tiempo, el automóvil puede realizar operaciones básicas como ajuste de velocidad, mantener la distancia, cambiar de carril y adelantar mientras conduce.

Las empresas de tecnología de Internet fabrican principalmente software, principalmente en el nivel superior de máquinas de ingeniería, de hecho, las fábricas de automóviles se centran principalmente en el ensamblaje del nivel inferior, es decir, la producción OEM, y no están tan familiarizadas con él; coches. En los ámbitos de frenado, acelerador, dirección, etc., el derecho a hablar todavía se concentra en los países de nivel 1, como Bosch y China.

La tecnología central del control de conducción automática es la tecnología de control longitudinal y control lateral del vehículo. Control longitudinal, es decir, control de conducción y frenado del vehículo; control lateral, es decir, ajuste del ángulo del volante y control de la fuerza de los neumáticos. Se logra un control automático vertical y horizontal, y la operación del vehículo se puede controlar automáticamente de acuerdo con objetivos y limitaciones determinados. Así, desde el propio coche, la conducción autónoma supone un control integral longitudinal y lateral.

El control longitudinal del vehículo es el control en el sentido de la velocidad de conducción, es decir, controla automáticamente la velocidad del vehículo y la distancia entre el vehículo y los vehículos de delante y detrás u obstáculos. El control de crucero y el control de frenado de emergencia son ejemplos típicos de control longitudinal de conducción autónoma. Estos problemas de control pueden atribuirse al control de los motores, transmisiones y sistemas de frenos. Varios modelos de motor-motor-transmisión, modelos de conducción de vehículos y modelos de proceso de frenado, combinados con diferentes algoritmos de controlador, forman varios modos de control longitudinal. La estructura típica se muestra en la figura.

Además, el control de la tasa de deslizamiento de las fuerzas de los neumáticos es una parte clave del control de estabilidad longitudinal. El sistema de control de la tasa de deslizamiento ajusta las características dinámicas longitudinales del vehículo controlando la tasa de deslizamiento de las ruedas para evitar que el vehículo se deslice excesivamente o se bloquee el frenado, mejorando así la estabilidad y el rendimiento de manejo del vehículo. El sistema de frenos antibloqueo (ABS para abreviar) controla automáticamente la fuerza de frenado de los frenos durante el frenado para que las ruedas no se bloqueen y estén en estado de rodadura (la tasa de deslizamiento es aproximadamente del 20%), asegurando así que el suelo pueda proporcionar la máxima potencia de frenado a las ruedas. Algunas estrategias inteligentes de control de la tasa de deslizamiento utilizan suficiente información de detección ambiental para diseñar reguladores de la tasa de deslizamiento máxima para las ruedas que cambian con el entorno de la carretera, mejorando así el efecto de tensión de los neumáticos.

Estrategias de control inteligentes, como control difuso, control de redes neuronales, control de optimización del dominio del tiempo rodante, etc. , también ha sido ampliamente investigado y aplicado en el control longitudinal, ha logrado buenos resultados y se considera el método más eficaz.

Los métodos de control tradicionales, como el control PID y el control de bucle abierto anticipado, generalmente establecen un modelo lineal aproximado del proceso de movimiento del motor y del vehículo, y diseñan el controlador sobre esta base. El control logrado por este método tiene una gran dependencia del modelo, un gran error del modelo y poca precisión y adaptabilidad. A juzgar por los artículos y proyectos de investigación actuales, la búsqueda de modelos simples y precisos del tren de transmisión del motor, del proceso de frenado y del movimiento del vehículo, así como de controladores que sean resistentes a las perturbaciones aleatorias y adaptables a los cambios en el rendimiento del vehículo, sigue siendo un desafío. prioridad El contenido principal de la investigación.

El control lateral del vehículo se refiere al control perpendicular a la dirección del movimiento, que también es el control de dirección del coche. El objetivo es controlar el automóvil para mantener automáticamente la ruta de conducción deseada, con buen confort de marcha y estabilidad bajo diferentes velocidades, cargas, resistencia al viento y condiciones de la carretera.

Existen dos métodos de diseño básicos para el control lateral de un automóvil. Uno se basa en la simulación del conductor; el segundo es un método de control que proporciona un modelo mecánico del movimiento lateral del automóvil. Basado en el método de simulación del conductor, una estrategia es utilizar un modelo cinemático simple y reglas de manipulación del conductor para diseñar el controlador; la otra estrategia es utilizar los datos del proceso de manipulación del conductor para entrenar al controlador y obtener el algoritmo de control; El método basado en el modelo cinemático debería establecer un modelo más preciso del movimiento lateral del vehículo. Un modelo típico es el llamado modelo monorraíl, o modelo de bicicleta, lo que significa que las características de los lados izquierdo y derecho del coche son las mismas. La estructura básica del sistema de control lateral es la siguiente. El objetivo de control es generalmente la desviación entre el centro del vehículo y la línea central de la carretera, y también está sujeto al confort y otros indicadores.