La inteligencia artificial y las cámaras inspiradas en la naturaleza mejoran la detección de peatones en los coches

Es la pesadilla de todo conductor: un peatón aparentemente se pone delante del coche de la nada, dejando sólo una fracción de segundo para frenar o girar y evitar lo peor. Algunos automóviles ahora tienen sistemas de cámaras que pueden alertar al conductor o activar el frenado de emergencia. Pero estos sistemas aún no son lo suficientemente rápidos ni confiables y necesitarán mejoras significativas si se van a utilizar en vehículos autónomos donde no hay ningún ser humano detrás del volante.

Descubrimiento más rápido con menos potencia computacional

Ahora, Daniel Gehrig y David Scaramuzza del Departamento de Informática de la Universidad de Zurich (UZH) han combinado una nueva cámara inspirada en la vida con inteligencia artificial para desarrollar un sistema que puede detectar obstáculos alrededor de un automóvil mucho más rápido que los sistemas existentes y usando menos cálculo. fuerza. El estudio se publica en la edición de esta semana de Nature.

La mayoría de las cámaras actuales se basan en cuadros, lo que significa que toman fotografías a intervalos regulares. Los que se utilizan actualmente para ayudar al conductor en automóviles suelen capturar entre 30 y 50 fotogramas por segundo, y se puede entrenar una red neuronal artificial para que reconozca objetos en sus imágenes: peatones, bicicletas y otros automóviles. “Pero si algo sucede en los 20 o 30 milisegundos entre dos tomas, la cámara podría verlo demasiado tarde. La solución sería aumentar la velocidad de fotogramas, pero eso se traduce en más datos que deben procesarse en tiempo real y más cálculos. .”Poder”, dice Daniel Gehrig, primer autor de este artículo.

READ  Porsche presenta el 911 GT2 RS Clubsport 25 Stunning Edition

Combinando lo mejor de dos tipos de cámaras con inteligencia artificial

Las cámaras para eventos son una innovación reciente basada en un principio diferente. En lugar de una velocidad de cuadros fija, estos dispositivos tienen píxeles inteligentes que registran información cada vez que detectan movimientos rápidos. “De este modo, no tienen puntos ciegos entre los fotogramas, lo que les permite detectar obstáculos más rápidamente”, afirma Davide Scaramuzza, jefe del Grupo de Robótica y Percepción. “También se llaman cámaras neuronales porque imitan la forma en que el ojo humano percibe las imágenes. .” Pero tiene sus propios inconvenientes: puede pasar por alto objetos que se mueven lentamente y sus imágenes no se convierten fácilmente en el tipo de datos utilizados para entrenar un algoritmo de IA.

A Gehrig y Scaramuzza se les ocurrió un sistema híbrido que combina lo mejor de ambos mundos: se trata de una cámara estándar que recopila 20 imágenes por segundo, una velocidad de fotogramas relativamente baja en comparación con las que se utilizan actualmente. Sus imágenes son procesadas por un sistema de inteligencia artificial, llamado red neuronal convolucional, que ha sido entrenado para reconocer automóviles o peatones. Los datos de la cámara del evento se combinan con un tipo diferente de sistema de inteligencia artificial, llamado red neuronal de gráficos asíncronos, que es particularmente adecuado para analizar datos 3D que cambian con el tiempo. Las detecciones de la cámara de eventos se utilizan para predecir las detecciones de la cámara estándar y también mejorar su rendimiento. «El resultado es un detector óptico que puede detectar objetos a la misma velocidad que una cámara estándar que captura 5.000 fotogramas por segundo, pero requiere el mismo ancho de banda que una cámara estándar de 50 fotogramas por segundo», afirma Daniel Gehrig.

READ  ¿Se puede salvar Battlefield 2042 yendo a Free-to-Play?

Descubrimientos 100 veces más rápidos utilizando menos datos

El equipo probó su sistema con las mejores cámaras y algoritmos visuales actualmente disponibles en el mercado automovilístico y descubrió que permite realizar detecciones cien veces más rápido y, al mismo tiempo, reduce la cantidad de datos que deben transferirse entre la cámara y el ordenador de a bordo del vehículo. así como cálculos. La energía necesaria para procesar imágenes sin afectar la resolución. Lo más importante es que el sistema puede detectar eficazmente coches y peatones que entran en el campo de visión entre dos fotogramas sucesivos de una cámara estándar, proporcionando seguridad adicional tanto para el conductor como para los participantes del tráfico, lo que puede marcar una gran diferencia, especialmente a altas velocidades.

Según los científicos, este método podría volverse más potente en el futuro integrando cámaras con sensores LiDAR, como los que se utilizan en los coches autónomos. «Los sistemas híbridos como este podrían ser cruciales para permitir la conducción autónoma y garantizar la seguridad sin generar un crecimiento significativo en datos y potencia computacional», afirma Davide Scaramuzza.

/Liberación General. Este material de la organización/autores originales puede ser de naturaleza cronológica y está editado para mayor claridad, estilo y extensión. Mirage.News no asume posiciones corporativas ni partidos, y todas las opiniones, posiciones y conclusiones expresadas en este documento son únicamente las de los autores. Ver en su totalidad aquí.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *