1. Era anterior a Bellman
En la década de 1940, muchos académicos en los campos de la economía y la estadística descubrieron que la inducción hacia atrás podía resolver algunos problemas riesgosos sin un análisis cualitativo. -hacer problema. En su investigación sobre la teoría de juegos, von Neumann y Morgenstern encontraron el equilibrio perfecto en subjuegos del juego de forma extensional mediante inducción hacia atrás.
Abraham Wald, el fundador de la teoría estadística de la decisión, también aplicó su teoría a problemas de toma de decisiones de múltiples etapas. Posteriormente, Arrow, Blackwell y Girshick estudiaron la forma general de los problemas estadísticos de toma de decisiones y utilizaron métodos modernos de programación dinámica para aclarar y resolver este problema.
Además, Arrow, Harris y Marschak también utilizaron la inducción hacia atrás para estudiar estrategias óptimas de inventario.
2. Era Bellman
Casi al mismo tiempo, es decir, a partir de finales de la década de 1940, Richard Bellman descubrió gradualmente la estructura detrás de los problemas de toma de decisiones en múltiples etapas y señaló. Descubra cómo la inducción hacia atrás puede resolver una gran clase de problemas de toma de decisiones de múltiples etapas. A partir de 1949, Bellman comenzó su investigación sobre programación dinámica en RAND Corporation. Cuando la industria de la moda no tenía este término, más tarde Behrman lo nombró.
El trabajo principal de Bellman es dar el principio de optimización de la programación dinámica. Hay documentos importantes aquí, a saber, varios artículos importantes publicados sobre Bull en 1953 y 1954. Amir. matemáticas. Los socialistas y la investigación de operaciones, incluida la teoría de la programación dinámica, algunas aplicaciones de la teoría de la programación dinámica: una revisión. Su hito fue la "Programación dinámica" publicada por Princeton University Press en 1957, que marcó el establecimiento formal de la teoría de la programación dinámica.
Después de eso, la investigación de Bellman estuvo activa hasta la década de 1960. Durante este período, realizó una serie de trabajos de investigación sobre la expansión del alcance de la aplicación de la programación dinámica. También escribió muchos artículos importantes, que no lo son. enumerados aquí.
3. Era post-Bellman
Después del establecimiento del sistema teórico básico, la programación dinámica ha entrado en un período de desarrollo integral y el trabajo de investigación tiene muchas direcciones. En resumen, una es la generalización del sistema teórico y la otra es la modificación de algunas condiciones de la teoría original, incluido el principio de optimización, para adaptarse a algunos problemas nuevos especiales.
El trabajo de investigación en esta etapa es bastante complejo. Es difícil enumerarlos todos aquí. Simplemente daré algunas ramas. El primero es el estudio de la llamada maldición de la dimensionalidad, el segundo es la aplicación en programación de enteros no lineales separables a gran escala, el tercero es la programación dinámica difusa y el cuarto es la investigación cruzada con otros campos matemáticos como el diferencial parcial. ecuaciones.
Esta división se basa exclusivamente en consideraciones históricas y puede no ser razonable en términos del contenido temático. Pero creo que sigue siendo útil para los investigadores jóvenes ordenar el contexto básico.