¿Quién puede contarme la historia del algoritmo de Monte Carlo en detalle?

Lo noté cuando salió la serie de pesos del "Método Monte Carlo", pero debido a la falta de tiempo recientemente, no tuve tiempo de leer detenidamente el primer "Método Integral" hasta esta noche. En general está claro y espero continuar. Dado que toda la estadística bayesiana se basa en cálculos de Monte Carlo, siempre me ha interesado esta área. Sin embargo, dado que no existe la posibilidad de utilizar estadísticas bayesianas en trabajos de investigación y el conocimiento relevante es la experiencia indirecta, definitivamente será beneficioso discutir este tema en este foro.

Antes de comentar, recomiendo algunos materiales de referencia. Creo que la siguiente lista es bastante buena, pero aún no he tenido tiempo de profundizar en ella:

*Aquellos que tengan dificultades psicológicas con las obras en inglés pueden consultar un excelente libro de texto en chino: "Numbers" de Sr. Feng Kang.

Capítulo 7 Método Monte Carlo (National Defense Industry Press, 1978);

*Una monografía en inglés muy legible escrita por Liu Jun, profesor de la Universidad de Harvard en Estados Unidos, " Monte Carlo"

Estrategia en Computación Científica" (Springer 2002);

* Aquellos que estén interesados ​​en la amplia aplicación de los métodos de Monte Carlo en la estadística bayesiana pueden consultarlo apropiadamente.

Análisis de datos bayesianos (Segunda edición,

Parte 3, 2003)

El propósito de la publicación en el foro de física Obviamente enfatizar la aplicación de este método. en física. Elegí comentar en el foro de matemáticas porque presto más atención a sus antecedentes estadísticos.

& gt& gtMonte Carlo es una ciudad ubicada en la costa mediterránea, famosa por sus casinos y hoteles de lujo. , entonces existe un método estocástico aplicado a los cálculos numéricos llamado Monte Carlo

Sí. La descripción más precisa de los antecedentes históricos del método Monte Carlo proviene de la monografía de Liu Jun, señaló un grupo de físicos. Inventó un método de cálculo numérico basado en muestreo estadístico para estimar los valores propios de la ecuación de Schrödinger durante la Segunda Guerra Mundial y le atribuyó la idea original. Más tarde, el colega de Ulam, Metropolis, llamó a este método Monte Carlo. Metropolis y varios colegas en física estadística publicaron un artículo clásico que propone el algoritmo Monte Carlo de cadena de Markov (MCMC). El método MCMC es la principal fuerza impulsora para el progreso continuo de la estadística bayesiana

& gt& gtI = ∫ f. (x)p(x)dx

Se puede enfatizar aquí por un momento, x es un vector y esta integral es la definición básica de expectativa matemática en estadística de probabilidad, que se puede escribir como E. (f(x)). Para principiantes, no olviden que el valor de la función de densidad de probabilidad p(x) puede ser mayor que 1. La condición de normalización es para la función de densidad acumulativa

&. gt& gtLa transformación anterior es el espíritu básico de la integración de Monte Carlo, porque se requiere un muestreo aleatorio y los errores estadísticos son inevitables. La motivación para el muestreo es estimar directamente un valor de probabilidad utilizando la frecuencia en el experimento de simulación numérica, y este valor de probabilidad es el. La clave para calcular muchas integrales complejas de alta dimensión. La simulación numérica necesita generar una secuencia de números aleatorios para garantizar la aleatoriedad del proceso de muestreo

& gt& gtPorque x_i es una variable aleatoria distribuida según la densidad de probabilidad p. (x), por lo que f(x_i) también es una variable aleatoria

Para mayor claridad, se debe decir que x_i es una variable aleatoria, por lo que f(x_i) es una variable aleatoria (. escalar).

& gt& gtEl teorema del límite central nos dice que la distribución de probabilidad de la suma de un conjunto de variables aleatorias independientes es una distribución gaussiana cuya varianza es igual a cada una.

. & gt& gtLa suma de varianzas de variables aleatorias

La expresión del "teorema del límite central" aquí no es lo suficientemente precisa y puede confundir fácilmente a los lectores. Según tengo entendido, este artículo parafrasea en inglés la definición del libro de texto de teoría de la probabilidad escrito por el Sr. Xu, un famoso maestro de estadística matemática en mi país:

[Teorema del límite central] Para mutuamente independientes (o débilmente correlacionadas) variables aleatorias X_1, p>

Donde N(0,1) representa la distribución gaussiana estándar. Esto significa que la forma de distribución de Xbar se parece cada vez más a una variable aleatoria gaussiana a medida que n aumenta.

En la expresión china del peso, se omite la importante condición de que este grupo de variables aleatorias debe provenir de la misma población, y "es gaussiano" se cambia por "cuando n aumenta, tiende a gaussiano". distribución."

& gt& gtAl calcular integrales de alta dimensión, el método Monte Carlo es una mejor opción.

No basta con explicar la superioridad del método Monte Carlo en situaciones de alta dimensión desde la perspectiva de la velocidad de convergencia. Más importante aún, ¡la precisión de los resultados de la simulación Monte Carlo no tiene nada que ver con la dimensión d de la probabilidad! La precisión de los resultados es obviamente más importante que la velocidad de convergencia, por lo que el método Monte Carlo es particularmente adecuado para resolver problemas de alta dimensión.

También cabe señalar que la velocidad de convergencia del método de Monte Carlo es O(1/√N), que no se puede mejorar teóricamente. La clave es reducir la varianza mediante un diseño inteligente de probabilidades de simulación y métodos de muestreo mejorados en aplicaciones prácticas. La habilidad de reducir la varianza es un indicador importante de los méritos de varios métodos de Monte Carlo.

& gt& gtPara finalizar este artículo, también podríamos repasar el experimento de lanzamiento de agujas de Buffon. Se pide que las agujas se dejen caer al suelo con las vetas de la madera equidistantemente paralelas.

& gt& gtLa longitud de la aguja es menor que la distancia entre las vetas de la madera. Los resultados del cálculo de la probabilidad geométrica muestran que la probabilidad de que la aguja se cruce con la veta de la madera puede ser

& gt& gtDesde la perspectiva de la longitud de la aguja, el espaciado de las vetas de la madera y pi. La probabilidad calculada utilizando la probabilidad geométrica se reduce esencialmente al área.

& gt& gtCálculo, es decir, el cálculo de integrales. Se puede decir que el experimento de lanzamiento de agujas de Buffon es el creador del cálculo de integrales mediante muestreo aleatorio.

El experimento de lanzamiento de agujas de Buffon puede parecer simple, pero vale la pena saborear la idea de probabilidad geométrica que contiene. La longitud de la aguja es L y la distancia entre las vetas de la madera es S. L

H & lt= (L/2) sin(a)

Entonces, la probabilidad de que el puntero intersecta la línea paralela es dos La relación de dos áreas:

p =∫_0^π(l/2)sin(a)da/(πs/2)= 2l/(πs)

Este es el peso. Dijo: "El cálculo de probabilidad usando probabilidad geométrica se reduce esencialmente al cálculo del área, es decir, al cálculo de la integral si la integral en el numerador de la fórmula anterior es una". Integral compleja de alta dimensión, podemos simularla usando el método de Monte Carlo para estimar el valor p. Por supuesto, si estamos interesados ​​en estimar el valor de π para números irracionales, entonces podemos deducir de la fórmula anterior:

π_hat = lim 2L ​​​​/ (S p_n)

En el límite n tiende al infinito positivo.

Espero que Quanquan pueda hablar sobre los siguientes cuatro métodos de muestreo de Monte Carlo en la próxima serie de artículos:

*Muestreo de petróleo crudo

*Muestreo de aceptación-rechazo

* Muestreo estratificado

* Muestreo de importancia

Sería más fascinante si pudiéramos hablar de la aplicación del método MCMC en física estadística.