El Aprendizaje Profundo aplicado al procesamiento de imágenes y vídeos se trata de una actividad cada vez mas presente en la actualidad. Dentro de esta aplicación de lo que hoy día conocemos como Inteligencia Artificial, destacamos las conocidas redes neuronales para la detección y clasificación de objetos en imágenes, lo cual resulta muy útil en una gran amplitud de campos.
Podemos destacar su uso en el sector sanitario por la gran rapidez con la que se puede procesar elevadas cantidades de datos, siendo muy relevante en el análisis de diferentes pruebas médicas. También encontramos aplicaciones interesantes en áreas como la cartografía, sistemas de información geográficos, conducción autónoma, metalurgia …
El estudio se centra en la problemática existente por el impacto que provoca determinados factores, como el ruido gaussiano y el brillo en el rendimiento de los diferentes modelos de redes neuronales más comunes.
Una gran cantidad de redes neuronales, se entrenan a través de conjuntos de datos que no tienen en cuenta estos factores, los cuales están presentes en casi cualquier dispositivo que recoja y transmita información. El factor del brillo junto con el ruido afectan al rendimiento de forma negativa, especialmente en las redes neuronales especializadas en tareas como la detección de objetos o patrones.
En la realización de los análisis cualitativos y cuantitativos de los resultados observamos como algunas de las versiones estudiadas en función del área de extensión de los objetos en las imágenes adquieren un comportamiento muy parecido. Mientras que otras versiones de YOLO se centran en tareas en las que se necesite rapidez y eficiencia, ciertas versiones del modelo estudiado de Faster R- CNN, son mucho más precisas, aunque más lentas generalmente.