En este trabajo, proponemos una solución para permitir la ejecución de
aplicaciones de tipo streaming, que constan de una serie de
etapas, sobre arquitecturas heterogéneas con un multicore y
una GPU integrada. Para ello, presentamos una API que permite especificar el nivel de paralelismo explotado
en el multicore, la asignación de las etapas del pipeline a los procesadores (CPU y GPU), y el número de threads. Usando una aplicación real de tipo streaming como caso de estudio, evaluamos el impacto que tienen los
parámetros anteriores sobre el rendimiento y la eficiencia energética
de un procesador heterogéneo (Exynos 5 Octa) que se
caracteriza por tener 3 tipos de procesadores: Una GPU, un
quad-core ARM Cortex A15 y un quad-core ARM Cortex
A7. Además, exploramos algunas optimizaciones de memoria y descubrimos
que el resultado de las mismas depende del tipo de la granularidad del
trabajo, y que además ayudan a reducir el consumo de energía.