Mostrar el registro sencillo del ítem
Estudio experimental de diversos algoritmos de aprendizaje por refuerzo
dc.contributor.advisor | Pérez-de-la-Cruz-Molina, José Luis | |
dc.contributor.author | García Carrasco, Alejandro Jesús | |
dc.contributor.other | Lenguajes y Ciencias de la Computación | es_ES |
dc.date.accessioned | 2021-01-18T07:37:37Z | |
dc.date.available | 2021-01-18T07:37:37Z | |
dc.date.created | 2020-09 | |
dc.date.issued | 2021-01-18 | |
dc.identifier.uri | https://hdl.handle.net/10630/20718 | |
dc.description.abstract | Los algoritmos desarrollados en este trabajo pretenden resolver mediante aprendizaje por refuerzo tres entornos distintos (Taxi, Cartpole y MountainCar) proporcionados por el framework OpenAI Gym [1] y hacer una comparativa del rendimiento de estos algoritmos. Para ello, una vez implementados los distintos algoritmos, se ejecutarán un número determinado de veces con el fin de poder evitar el factor aleatoriedad y poder hacer una comparativa sobre las mismas condiciones. El código a desarrollar se podría dividir principalmente en dos partes, el Agente contiene la mayor parte de código y es el “cerebro”, el encargado de resolver el problema y llegar encontrar una solución dado un entorno. Y una segunda parte encargada de reportar los datos del entrenamiento del agente, tanto en forma de gráfica para ver el rendimiento, como en forma de tabla para poder hacer una mejor comparativa. Para la implementación se utilizan el framework OpenAI Gym, Python 3.7 [2] así como diversas librerías y el entorno PyCharm | es_ES |
dc.language.iso | spa | es_ES |
dc.rights | info:eu-repo/semantics/openAccess | es_ES |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | * |
dc.subject | Algoritmos computacionales | es_ES |
dc.subject | Interacción hombre-ordenador | es_ES |
dc.subject | Aprendizaje automático (Inteligencia artificial) | es_ES |
dc.subject | Informática - Trabajos Fin de Grado | es_ES |
dc.subject | Grado en Ingeniería Informática - Trabajos Fin de Grado | es_ES |
dc.subject.other | Aprendizaje por refuerzo | es_ES |
dc.subject.other | Python | es_ES |
dc.subject.other | Algoritmo | es_ES |
dc.subject.other | QLearning | es_ES |
dc.subject.other | Sarsa | es_ES |
dc.subject.other | Expected-Sarsa | es_ES |
dc.subject.other | Alfa | es_ES |
dc.subject.other | Épsilon. | es_ES |
dc.title | Estudio experimental de diversos algoritmos de aprendizaje por refuerzo | es_ES |
dc.title.alternative | Experimental study of some algorithms of Reinforcement Learning | es_ES |
dc.type | info:eu-repo/semantics/bachelorThesis | es_ES |
dc.centro | E.T.S.I. Informática | es_ES |
dc.rights.cc | Attribution-NonCommercial-NoDerivatives 4.0 Internacional | * |