Revista de Sistemas, Cibernética e Informática | |
Una Cota de Convergencia para los Minimizadores en un Modelo Lineal Cuadrático | |
关键词: procesos de control de markov descontados; programación dinámica; modelos de control de markov; modelos lineales cuadráticos; | |
DOI : | |
来源: DOAJ |
【 摘 要 】
En este artículo se presenta un modelo lineal cuadrático estocástico en tiempo discreto. Se considera como criterio de rendimiento al costo total descontado esperado con horizonte infinito. Para este problema se da la primera y segunda derivada del lado derecho de la ecuación de programación dinámica. Con estas derivadas se desarrolla la serie de Taylor para el lado derecho de la ecuación de programación dinámica alrededor de la política óptima. Con dicha serie de Taylor se relacionan las funciones de valor con los minimizadores provenientes del algoritmo de iteración de valores y con ello se determina una cota de convergencia.
【 授权许可】
Unknown