Uno de los grandes avances terapéuticos es la medicina personalizada, que se basa en biomarcadores que ayudan en la filiación y elección del tratamiento. La mayoría de los biomarcadores se basan en variaciones génicas y solo recientemente se está prestando atención a la expresión diferencial de los genes codificantes que suponen solo un 2% del genoma humano. En cambio, el 45\% del genoma está formado por las secuencias repetitivas y transposones que han sido poco estudiados como biomarcadores debido a la dificultad de su secuenciación y análisis.
Esta tesis contribuye a la búsqueda de biomarcadores usando datos generados a partir de la ultrasecuenciación del transcriptoma completo de tejido sano y tumoral de la misma persona, para que los resultados dependan solo la enfermedad y no del individuo. Las muestras se han obtenido a partir de las secuencias albergadas en bases de datos públicas (50 pacientes de adenocarcinoma y 17 de cáncer microcítico) y a partir de la secuenciación de muestras ultracongeladas de tejido sano y tumoral de pacientes operados en el Hospital Regional Universitario de Málaga (8 pacientes de adenocarcinoma y 8 pacientes de epidermoide), de los que se han generado de media más de 60 millones de lecturas por muestra. Se han diseñado dos nuevos flujos de trabajo bioinformáticos para la búsqueda de biomarcadores en genes, secuencias repetitivas y transposones, y para analizar la colocalización de genes y transposones.
Entre los elementos repetitivos que se proponen como biomarcadores encontramos HERVK10D-Int sobreexpresado en adenocarcinoma y no en microcítico, y UCON88 sobreexpresado en microcítico y sin presentar expresión en adenocarcinoma, y tres (HERVL18-int, AluYg6 y LTR18B) con expresión diferencial en el mismo sentido en ambos tipos histológicos de cáncer.