En este trabajo Fin de Grado (TFG) se ha desarrollado una
herramienta genérica, siguiendo una arquitectura de Microservicio REST,
para implementar operaciones de cruce (join) en fuentes de datos Cassandra
de gran volumen con Apache Spark. Además, la herramienta se ha aplicado a
un caso de uso de la Web Semántica, con el que se ha conseguido evaluar
consultas SPARQL en un repositorio de datos Apache Cassandra que
almacena una ontología OWL materializada. Apache Cassandra es una base
de datos NoSQL (Not only SQL) distribuida orientada a columna, cuyo
lenguaje de consultas, por razones de rendimiento y de la propia arquitectura
de la base de datos, no permite hacer operaciones de tipo join entre tablas. La
herramienta genérica desarrollada en este TFG cubre esta carencia de forma
escalable gracias al uso de Apache Spark. Además, se ha conseguido
desacoplar la lógica necesaria para realizar dichos cruces para el Caso de uso
Específico. Esto permite aplicar dicha herramienta genérica a otros casos de
uso futuros. Como producto final, se ha desarrollado un interfaz Web que
permite ejecutar consultas SPARQL sobre una ontología con información
sobre diferentes disciplinas artísticas. Las consultas son modificables por el
usuario, pudiendo éste generar cualquier consulta nueva sobre el
conocimiento almacenado.