Mejorando los sistemas de monitoreo de conductores El caso de los datos sintéticos

Mejora de sistemas de monitoreo conductores con datos sintéticos

Los sistemas de monitoreo del conductor (DMS) que evalúan la atención al volante se están convirtiendo rápidamente en la principal característica de seguridad automotriz en todo el mundo. En la UE, por ejemplo, el regulador de seguridad de vehículos EuroNCAP exige que todos los nuevos automóviles incorporen un DMS para cumplir con su clasificación de seguridad.

En medio de este impulso, las startups se están beneficiando de oportunidades comerciales en el espacio de DMS, ofreciendo soluciones que van desde la medición del ritmo cardíaco hasta la detección del inicio del sueño. Entre ellas, la empresa sueca Devant está aprovechando el potencial de los datos sintéticos.

Lanzada en 2021, la startup genera datos sintéticos de seres humanos digitales realistas para respaldar la capacitación, validación y prueba de redes de aprendizaje automático, como las que se encuentran detrás de los sistemas de monitoreo del conductor. Específicamente, desarrolla seres humanos simulados en 3D que son diversos tanto en apariencia como en comportamiento en diferentes situaciones.

Pero, ¿cómo puede mejorar exactamente los DMS los datos sintéticos? TNW habló con Richard Bremer, cofundador y CEO de Devant, para obtener más información.

La brecha que los datos sintéticos pueden llenar

El interés en los datos sintéticos comenzó en la década de 1990, y no pasó mucho tiempo antes de que la industria tecnológica se diera cuenta del valor de la tecnología para acelerar el aprendizaje automático.

El sector automotriz fue uno de los primeros defensores de los datos sintéticos, adoptándolos a mediados de la década de 2010 para el desarrollo de vehículos autónomos, sistemas avanzados de asistencia al conductor (ADAS) y, más recientemente, DMS.

Opiniones de los conductores sobre la conducción distraída en la UE, 2019. Fuente: Encuesta ESRA/Pires et al.

Los sistemas de monitoreo del conductor y del ocupante (DMS y OMS) utilizan típicamente cámaras infrarrojas y sensores para recopilar información en tiempo real sobre el conductor y los pasajeros. Gracias a la visión por computadora y al aprendizaje automático, esta información se analiza para, por ejemplo, rastrear la mirada o las expresiones faciales del conductor, y determinar su nivel de alerta y atención a la carretera.

Esto significa que, para funcionar al máximo rendimiento, tanto los DMS como los OMS deben entrenarse con una gran cantidad de datos de alta calidad, que incluyan imágenes y grabaciones que capturen la mayor cantidad posible de situaciones diversas. Piense en conductores enviando mensajes de texto en su teléfono, bebiendo al volante o incluso inclinándose hacia los asientos traseros para detener a sus hijos peleando.

“Para cualquier red de inteligencia artificial, la cantidad y calidad de los datos son esenciales.”

Aunque hasta ahora los datos de cámaras e incluso la interpretación de actores han impulsado el desarrollo de los DMS, utilizar solo estas fuentes para capturar todas las situaciones imaginables conlleva múltiples desafíos. Es costoso, lleva mucho tiempo, tiene limitaciones en cuanto a variabilidad y está asociado con preocupaciones de privacidad.

Aquí es donde entra en juego el valor de los datos sintéticos, según Bremer. “El potencial y la parte interesante de los datos sintéticos es que se puede reducir el tiempo y el costo, y también aumentar el rendimiento de la red.”

Cómo funciona la tecnología de Devant

La startup con sede en Norrköping utiliza un proceso paso a paso en su plataforma, combinando diferentes tipos de activos en 3D para crear imágenes y animaciones. En el caso del sector automotriz, este contenido puede ser cabinas y personas en 3D, complementados con detalles como accesorios, prendas de vestir o gafas.

Animación de un conductor inclinándose hacia atrás. Crédito: Devant

Para garantizar un resultado de alta calidad que no afecte el rendimiento de una red de aprendizaje automático, la confiabilidad y precisión de los datos se validan mediante una serie de sistemas de evaluación de calidad en todo el proceso.

“En lo que respecta a lo que hemos construido, se trata principalmente de asegurarse de que los datos hayan sido probados y validados”, dice Bremer.

El objetivo de Devant para sus modelos humanos en 3D es triple: alinearse con cómo se ven las cosas en el mundo real, ampliar su diversidad y ofrecer la mayor variedad posible de escenarios diferentes, y satisfacer los requisitos del cliente.

Por esta razón, la startup sueca ofrece una herramienta de configuración para que los usuarios seleccionen los parámetros que correspondan a sus necesidades. Los ajustes pueden variar desde variables más genéricas (como edad, etnia y sexo) hasta detalles más específicos, como la ropa, la frecuencia de movimiento de los párpados o las condiciones de iluminación dentro de un vehículo.

Animación de distraerse con el teléfono. Crédito: Devant

En junio, la compañía se unió con Seeing Machines, con sede en Australia, un desarrollador de (DMS y OMS) utilizado por importantes fabricantes de automóviles.

A través de la asociación, Seeing Machines utilizará las simulaciones 3D de Devant para entrenar y validar sus redes de aprendizaje automático, con el objetivo de mejorar aún más sus sistemas de monitoreo en la cabina y crear un conjunto de datos a gran escala de comportamientos de conductores distraídos que cumplan con los requisitos de EuroNCAP.

La calidad es tan esencial como la cantidad

Para aprovechar verdaderamente el potencial de los datos sintéticos, no se trata solo de presionar un botón y generar millones de imágenes en pocos días, explica Bremer. También se trata de la calidad y precisión de los datos.

La premisa es simple. “Para que cualquier red de IA funcione lo mejor posible, la cantidad suficiente y la calidad suficiente son esenciales”.

El aspecto prometedor de los datos generados por computadora es que “sabemos exactamente, hasta el nivel de píxel, qué contiene cada imagen gracias a los metadatos adjuntos”, dice Bremer. En contraste, cuando se trata de datos del mundo real, “no tienes ese nivel de control y precisión granular como lo tienes con los datos sintéticos”.

Animación de un conductor inclinándose hacia atrás. Crédito: Devant

Pero hay un problema. Cuanto más aumentas la calidad de los datos agregando más parámetros y realismo para cubrir la gran cantidad de escenarios y comportamientos humanos posibles, más complejo se vuelve. Esto, a su vez, aumenta los tiempos de renderizado.

“Por eso nadie antes que nosotros ha tomado este enfoque de calidad para los datos sintéticos, porque es tan costoso en términos de tiempos de renderizado”, afirma Bremer. De hecho, Devant luchó durante mucho tiempo para resolver el enigma de mantener la calidad mientras optimizaba la velocidad.

Limitaciones actuales

A pesar de la clara ventaja de los datos sintéticos en cuanto a cantidad y su capacidad para proporcionar simulaciones precisas y de alta calidad, Bremer enfatiza que la tecnología no debe verse como “una solución mágica”. Al menos, aún no.

En cambio, dice, reemplazar los datos del mundo real con su equivalente generado por computadora debe hacerse de manera gradual y cautelosa.

“Creo que lo más importante que hay que recordar aquí es que los sistemas DMS son críticos para la vida”, señala. Y aún hay varios desafíos por superar, que van más allá de la necesidad de tener miles de modelos 3D para garantizar una cobertura suficiente.

Richard Bremer, cofundador y CEO de Devant. Crédito: Devant

El primer desafío es establecer un umbral para lo que constituye datos buenos y malos, lo cual Devant explorará en colaboración con Seeing Machines. El segundo es identificar exactamente qué datos reconocerá la red de aprendizaje automático como lo suficientemente importantes como para usarlos.

La startup también está haciendo un esfuerzo adicional para cubrir más aspectos de la óptica de la cámara. “Simular diferentes parámetros de cámara es muy complejo, especialmente cuando necesitas hacerlo dentro de un tiempo de renderizado limitado por imagen”, explica Bremer.

El camino a seguir

Hasta ahora, Devant ha estado trabajando en los diferentes niveles de distracción del conductor, centrándose especialmente en simular de manera realista el ojo, con sus diferentes movimientos, comportamientos de los párpados y diferentes tamaños de pupilas.

A través de la asociación con Seeing Machines, la startup tiene como objetivo subir en la escalera de la complejidad y seguir agregando características que cubrirán el protocolo completo de EuroNCAP. A partir de ahí, Bremer ve la somnolencia como “lo siguiente natural”, y la intoxicación como otra posibilidad interesante en la lista de la compañía.

La decisión de Devant de desarrollar datos sintéticos centrados en el ser humano para la industria automotriz fue desde el principio un enfoque dirigido, impulsado por la oportunidad comercial presentada por la creciente atención a los DMS y las próximas regulaciones de la UE. Según Bremer, también se trataba de generar un valor real y utilizar la tecnología de una manera que beneficie a las personas.

Más allá del espacio automotriz, la startup visualiza otras industrias potenciales donde su tecnología podría tener un impacto positivo, como entrenar sistemas de IA para detectar señales de enfermedades en una etapa temprana.