Esta tesis aborda los desafíos y oportunidades en el campo de <<massive data analytics>> mediante el desarrollo de métodos y herramientas para la extracción y análisis de información, centrándose en la intersección de la teoría de la información, enfoques algorítmicos y consideraciones arquitectónicas en dos aplicaciones específicas basadas en sensores: la extracción de puntos del terreno usando tecnología <<Light Detection and Ranging>> (LiDAR) y la detección de crisis epilépticas a partir de señales de electroencefalografía (EEG). Los objetivos de esta investigación buscan desarrollar métodos y herramientas para la extracción y análisis de la información de datos de sensores a gran escala, priorizando la precisión, así como la eficiencia computacional y energética en diferentes arquitecturas. Además, se prevé desplegar finalmente estas metodologías en dispositivos embebidos para aplicaciones en tiempo real. Entre las plataformas utilizadas se encuentran: CPUs multicore, GPUs integradas y discretas, así como <<System-on-Chip>> (SoC) heterogéneos de bajo consumo.
La primera parte de la tesis examina las técnicas de procesamiento asociadas con los datos LiDAR, abordando los desafíos que plantea el volumen y la complejidad de los datos generados por esta tecnología, en particular la selección de la estructura de datos adecuada, adaptada a las características de la arquitectura de cada acelerador en una plataforma heterogénea. Utilizando <<Overlap Window Method>> (OWM) y optimizaciones algorítmicas orientadas a minimizar los accesos a memoria y explotar todo el paralelismo disponible en el acelerador correspondiente, esta investigación propone soluciones para la extracción eficiente de puntos semilla para la representación del terreno en nubes de puntos LiDAR, estableciendo una base para metodologías de procesamiento en tiempo real. La implementación ha sido desplegada con éxito en las plataformas previamente mencionadas, incluyendo CPUs multicore y GPUs