Mostrar el registro sencillo del ítem

dc.contributor.advisorPérez-de-la-Cruz-Molina, José Luis 
dc.contributor.authorGarcía Carrasco, Alejandro Jesús
dc.contributor.otherLenguajes y Ciencias de la Computaciónes_ES
dc.date.accessioned2021-01-18T07:37:37Z
dc.date.available2021-01-18T07:37:37Z
dc.date.created2020-09
dc.date.issued2021-01-18
dc.identifier.urihttps://hdl.handle.net/10630/20718
dc.description.abstractLos algoritmos desarrollados en este trabajo pretenden resolver mediante aprendizaje por refuerzo tres entornos distintos (Taxi, Cartpole y MountainCar) proporcionados por el framework OpenAI Gym [1] y hacer una comparativa del rendimiento de estos algoritmos. Para ello, una vez implementados los distintos algoritmos, se ejecutarán un número determinado de veces con el fin de poder evitar el factor aleatoriedad y poder hacer una comparativa sobre las mismas condiciones. El código a desarrollar se podría dividir principalmente en dos partes, el Agente contiene la mayor parte de código y es el “cerebro”, el encargado de resolver el problema y llegar encontrar una solución dado un entorno. Y una segunda parte encargada de reportar los datos del entrenamiento del agente, tanto en forma de gráfica para ver el rendimiento, como en forma de tabla para poder hacer una mejor comparativa. Para la implementación se utilizan el framework OpenAI Gym, Python 3.7 [2] así como diversas librerías y el entorno PyCharmes_ES
dc.language.isospaes_ES
dc.rightsinfo:eu-repo/semantics/openAccesses_ES
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectAlgoritmos computacionaleses_ES
dc.subjectInteracción hombre-ordenadores_ES
dc.subjectAprendizaje automático (Inteligencia artificial)es_ES
dc.subjectInformática - Trabajos Fin de Gradoes_ES
dc.subjectGrado en Ingeniería Informática - Trabajos Fin de Gradoes_ES
dc.subject.otherAprendizaje por refuerzoes_ES
dc.subject.otherPythones_ES
dc.subject.otherAlgoritmoes_ES
dc.subject.otherQLearninges_ES
dc.subject.otherSarsaes_ES
dc.subject.otherExpected-Sarsaes_ES
dc.subject.otherAlfaes_ES
dc.subject.otherÉpsilon.es_ES
dc.titleEstudio experimental de diversos algoritmos de aprendizaje por refuerzoes_ES
dc.title.alternativeExperimental study of some algorithms of Reinforcement Learninges_ES
dc.typeinfo:eu-repo/semantics/bachelorThesises_ES
dc.centroE.T.S.I. Informáticaes_ES
dc.rights.ccAttribution-NonCommercial-NoDerivatives 4.0 Internacional*


Ficheros en el ítem

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem

Attribution-NonCommercial-NoDerivatives 4.0 Internacional
Excepto si se señala otra cosa, la licencia del ítem se describe como Attribution-NonCommercial-NoDerivatives 4.0 Internacional