Los drones son un tipo de vehículo aéreo no tripulado (UAV) los cuales en los
últimos años se han convertido en una herramienta indispensable en multitud de
tareas debido a su enorme utilidad, bajo coste y facilidad de uso. La popularización
de estos aparatos ha traído consigo un aumento en la toma de imágenes aéreas.
En este tipo de imágenes normalmente aparecen objetos de pequeño tamaño. Detectar a los mismos suele ser un paso fundamental para extraer información de
acuerdo con el ámbito de aplicación. Existen múltiples modelos entrenados mediante algoritmos de aprendizaje profundo o Deep Learning que son capaces de
detectar de manera automática objetos en una imagen. No obstante, estos modelos han sido entrenados para identificar objetos de tamaño grande o mediano
principalmente. Por tanto, su tasa de detección o accuracy desciende conforme
los objetos en la imagen se hacen más pequeños, especialmente en imágenes de
baja calidad o con un fondo complejo. Las soluciones disponibles para la detección de este tipo de elementos a día de hoy son limitadas. Por ello, es necesario la
investigación y aporte de nuevas soluciones dentro de este campo.
En este trabajo se plantea un estudio empírico sobre la mejora en la detección
de objetos pequeños mediante la aplicación de redes neuronales convolucionales
(CNN), en conjunto con distintas técnicas de procesamiento de la imagen y superresolución durante la fase de inferencia. Este tipo de técnicas son conocidas como
Test Time Augmentation (TTA) y tienen como objetivo presentar al modelo de
detección la misma imagen de entrada con una serie de transformaciones para así
intentar aumentar la tasa de detección de los objetos en el fotograma sobre el cual
se desea inferir, y con ello, se logre aumentar el accuracy del modelo sin necesidad
de re-entrenar el mismo, ya que este es un proceso costoso computacionalmente,
quedando fuera de los límites de este trabajo.