- RIUMA Principal
- Listar por autor
Listar por autor "Ruiz-Montiel, Manuela"
Mostrando ítems 1-11 de 11
-
Aproximación Funcional en Aprendizaje por Refuerzo Multi-Objetivo
Ruiz-Montiel, Manuela (AEPIA, 2015)Describimos y comparamos dos t ecnicas para combinar m etodos de aproximaci on funcional y de escalarizaci on, con el objetivo de resolver problemas de aprendizaje por refuerzo con espacios de estados de tama~no elevado y ... -
BH-ShaDe: a software tool that assists architecture students in the ill-structured task of housing design
Millán-Valldeperas, Eva; Belmonte-Martínez, María Victoria; Ruiz-Montiel, Manuela; Gavilanes-Velaz-de-Medrano, Juan; Pérez-de-la-Cruz-Molina, José Luis (IEEE Transactions on Learning Technologies, 2016)In this paper, we present BH-ShaDe, a new software tool to assist architecture students learning the ill-structured domain/task of housing design. The software tool provides students with automatic or interactively generated ... -
Design with shapes grammars and reinforcement learning.
Ruiz-Montiel, Manuela; Boned-Purkiss, Francisco Javier; Gavilanes-Velaz-de-Medrano, Juan; Jiménez-Morales, Eduardo; Mandow-Andaluz, Lorenzo; Pérez-de-la-Cruz-Molina, José Luis[et al.] (Elsevier, 2013-01)Shape grammars are a powerful and appealing formalism for automatic shape generation in computer-based design systems. This paper presents a proposal complementing the generative power of shape grammars with reinforcement ... -
Gramáticas difusas de formas
Pérez-de-la-Cruz-Molina, José Luis; Mandow-Andaluz, Lorenzo; López-Romero, Fernando; Ruiz-Montiel, Manuela (AEPIA, 2015)Presentamos una generalización difusa del concepto de computacion o derivacion en una gramática de formas. Primeramente presentamos las ideas en abstracto y posteriormente describimos una implementacion software y algunos ... -
Multi-objective Reinforcement Learning
Ruiz-Montiel, Manuela (2013-09-25)In this talk we present PQ-learning, a new Reinforcement Learning (RL) algorithm that determines the rational behaviours of an agent in multi-objective domains -
New computational techniques for detecting, learning and managing criteria in design problems
Ruiz-Montiel, Manuela (UMA Editorial, 2016)Los problemas de diseño suelen involucrar la consideración de criterios de diferente naturaleza, incluyendo necesidades técnicas, económicas, sociales y medioambientales, entre otras. Las herramientas CAD tradicionales ... -
PQ-learning: aprendizaje por refuerzo multiobjetivo
En este artí culo describimos y analizamos PQ-learning, un algoritmo para problemas de aprendizaje por refuerzo multiobjetivo. El algoritmo es una extensi ón de Q-learning, un algoritmo para problemas de aprendizaje ... -
Proyecto Arquitectónico Energéticamente Eficiente Mediante Gramáticas de Formas y Aprendizaje por Refuerzo
Gavilanes-Velaz-de-Medrano, Juan; Hidalgo, Pablo; Belmonte, David; Mandow-Andaluz, Lorenzo; Ruiz-Montiel, Manuela (AEPIA, 2015)En este trabajo presentamos un sistema para la generación de esquemas de viviendas unifamiliares energéticamente eficientes. Los esquemas se sintetizan mediante la ejecución de gramáticas de formas simples, entrenadas por ... -
Proyecto arquitectónico mediante gramáticas de formas sencillas y aprendizaje.
Ruiz-Montiel, Manuela; Boned-Purkiss, Francisco Javier; Gavilanes-Velaz-de-Medrano, Juan; Jiménez-Morales, Eduardo; Mandow, Lawrence; Pérez-de-la-Cruz-Molina, José Luis[et al.] (Iberamia, 2014-12-18)En este artículo se presenta una propuesta para la generación automática de planos arquitectónicos. La propuesta se basa en el entrenamiento de gramáticas de formas muy sencillas mediante técnicas de aprendizaje por refuerzo. ... -
Randomness and control in design processes: an empirical study with architecture students.
Belmonte-Martínez, María Victoria; Millán-Valldeperas, Eva; Ruiz-Montiel, Manuela; Badillo, Reyes; Boned-Purkiss, Francisco Javier; Mandow-Andaluz, Lorenzo; Pérez-de-la-Cruz-Molina, José Luis[et al.] (2014-02-12)The aim of this study is to explore designers' preferences between randomness and control in the generation of architectural forms. To this end, a generative computer tool was implemented that allows both random and ... -
A temporal difference method for multi-objective reinforcement learning
This work describes MPQ-learning, an temporal-difference method that approximates the set of all non-dominated policies in multi-objective Markov decision problems, where rewards are vectors and each component stands for ...