Mostrar el registro sencillo del ítem
Creación y uso de los flujos de trabajo bioinformáticos
dc.contributor.advisor | Claros-Díaz, Manuel Gonzalo | |
dc.contributor.author | Seoane Zonjic, Pedro | |
dc.contributor.other | Biología Molecular y Bioquímica | es_ES |
dc.date.accessioned | 2017-07-10T10:51:33Z | |
dc.date.issued | 2016 | |
dc.identifier.uri | http://hdl.handle.net/10630/14172 | |
dc.description.abstract | En el año 2012 comencé mi doctorado en el Departamento de Biología Molecular y Bioquímica, aunque alojado en la Plataforma Andaluza de Bioinformática (PAB), emplazado en el edificio de Supercomputación y Bioinnovación sito en el Parque Tecnológico de Andalucía. En esta institución de la Universidad de Málaga se encuentran los recursos de supercomputación y de ultrasecuenciación (por aquel entonces equipada con un equipo Titanium FLX+ de ROCHE y a la que se ha añadido recientemente un NextSeq550 de Illumina). En agradecimiento a poder trabajar en semejante entorno, he ido poniendo a disposición de la PAB las herramientas que he desarrollado, sobre todo las que servían para automatizar y optimizar los protocolos usados en la manipulación de la información procedente de los experimentos de secuenciación. De ahí que el trabajo de mi tesis doctoral se haya encaminado a desarrollar las herramientas y realizar los estudios pertinentes para cubrir dicha tarea. Dada la naturaleza del trabajo a realizar, esta tesis presenta un carácter técnico y práctico, donde la mayoría de los estudios presentan nuevas herramientas o modificaciones de las mismas con el propósito de obtener conocimiento biológico útil para el investigador. De hecho, muchos de los trabajos aquí expuestos son fruto de la colaboración con otros grupos de investigación que necesitaban análisis bioinformáticos con sus datos de secuenciación. Así, la primera tarea que nos planteamos fue facilitar la gestión y la creación de flujos de trabajo automatizados. Para ello creamos una herramienta que, con una sintaxis sencilla, facilita a los usuarios con pocos conocimientos técnicos la posibilidad de crear su propios flujos de trabajo, lo cual garantiza la reproducibilidad de los resultados. Además, configura de forma automática gran parte de la gestión de recursos, con lo que descarga al usuario de una parte de este trabajo. Debido al uso intensivo de los flujos de trabajo y a la complejidad de la información manejada, es inevitable que los resultados de los análisis se acumulen al menos al mismos ritmo con el que se generan. La única manera de no verse desbordado por este problema es mantener organizados estos datos y ponerlos a disposición de manera intuitiva a la comunidad científica. Por ello, hemos puesto a punto dos sistemas de bases de datos, uno para información genómica y otro para información transcriptómica que se han usado en distintos proyectos de investigación, en algunos de los cuales he participado activamente, como en el transcriptoma reproductivo del olivo y de la haba, así como en el genoma de Symphonia, del pino marítimo y del garbanzo. De forma específica, para nuestros estudios de transcriptómica hemos desarrollado flujos de trabajo para construir transcriptomas de forma automática a partir de la información generada por las tecnologías de secuenciación 454 e Illumina. De hecho, esto ha dado lugar al desarrollo de una herramienta de anotación funcional y estructural para trabajar con secuencias de transcriptómica. Además, hemos realizado un estudio sobre herramientas de predicción de secuencias codificantes para poder identificar posibles secuencias específicas propias de un organismo de las que no existen evidencias en las bases de datos biológicas actuales. Por último, en cuanto a nuestros estudios de genómica, hemos ideado nuevas aproximaciones para genomas de organismos no modelo. Con estas aproximaciones se puede obtener la estructura exón-intrón de ciertos genes sin tener que secuenciar todo el genoma del organismo. Para ello hemos desarrollado una herramienta que es capaz de construir modelos de gen a partir de un conjunto de proteínas de referencia y el ensamblaje fragmentado del genoma de un organismo. Por otro lado, hemos desarrollado un flujo de trabajo para identificar y anotar genes en borradores de genomas. | es_ES |
dc.language.iso | spa | es_ES |
dc.publisher | UMA Editorial | es_ES |
dc.rights | info:eu-repo/semantics/openAccess | es_ES |
dc.subject | Bioinformática | es_ES |
dc.subject | Genomas | es_ES |
dc.subject.other | Genómica transcriptómica | es_ES |
dc.subject.other | Flujos | es_ES |
dc.subject.other | Tesis Doctoral | es_ES |
dc.title | Creación y uso de los flujos de trabajo bioinformáticos | es_ES |
dc.type | info:eu-repo/semantics/doctoralThesis | es_ES |
dc.centro | Facultad de Ciencias | es_ES |
dc.rights.cc | by-nc-nd |