Este artículo tiene como objetivo contribuir al desarrollo de la programación paralela trabajando en una de las herramientas desarrolladas por Intel: Intel Threading Building Blocks (Intel TBB). Hemos implementado una versión paralela de la aplicación ViVid, un algoritmo de detección de objetos, aprovechando la librería Flow Graph de TBB. En la última versión de esta librería se soporta un nuevo tipo de nodos que simplifica la ejecución de kernels OpenCL. Estos nodos OpenCL_node han simplificado la codificación de nuestro algoritmo para aprovechar al mismo tiempo tanto la CPU como la GPU. A la vista de los resultados obtenidos, podemos concluir que nuestra implementación heterogénea con Flow Graph y OpenCL_node mejora en gran medida a desarrollos anteriores, debido principalmente a explotar la técnica de zero-copy buffer entre GPU y CPU, en vez de lectura y escritura de buffers.