Si hablas de la relación padre-hijo más asombrosa en la historia de las matemáticas, puedes pensar en la familia Bernoulli. La familia Bernoulli produjo 8 matemáticos, tres de los cuales son matemáticos de talla mundial. En estadística, también existe la mejor relación de yerno de la historia. Se trata de Ronald Fisher (1890-1962) y George Box (1919-2013), dos científicos de gran peso en la estadística que han hecho contribuciones destacadas al diseño experimental. rama de la optimización estadística.
Sin embargo, es posible que la mayoría de la gente no esté familiarizada con el hecho de que un método de optimización de diseño experimental tan importante nació en realidad en una estación experimental agrícola llamada Lausana, la estación de investigación agrícola más antigua del mundo, y su inventor Se trata de Ronald Fisher, el maestro de la estadística. Presentó sistemáticamente sus exquisitos pensamientos sobre el diseño experimental en sus libros "Métodos estadísticos para investigadores" y "Diseño experimental".
Casualmente, George Box, yerno de Ronald Fisher, también heredó el profundo pensamiento estadístico de Fisher y desarrolló investigaciones en los campos del diseño experimental y los modelos de series temporales. Ha logrado grandes logros en la investigación y ha publicado un. Tiene una gran cantidad de artículos y libros importantes. Tiene un dicho famoso que los profesionales de la industria de la estadística y el big data consideran un clásico: "Todos los modelos son incorrectos, pero algunos son útiles". Box introdujo sistemáticamente su profundo conocimiento del diseño experimental en obras como "Operaciones evolutivas: un método estadístico para la mejora de procesos", "Estadísticas para experimentadores" y "Metodología de superficie de respuesta y modelado empírico", al mismo tiempo, durante sus ocho años. de pasantía y trabajo en Imperial Chemical Industries (ICI), estudió y exploró con sus colegas (químicos e ingenieros químicos) cómo diseñar y analizar experimentos para lograr el propósito de mejorar la eficiencia experimental, y propuso aprender cómo encontrar métodos sistemáticos para mejorar el rendimiento de las reacciones químicas más rápidamente.
El diseño experimental se utilizó inicialmente en la agricultura para aumentar el rendimiento por mu, y luego rápidamente se popularizó y promovió a actividades de producción y I+D en diversas industrias como la química, la medicina, la electrónica, la maquinaria, etc. Proceso, varias industrias Los investigadores profesionales se han dado cuenta gradualmente de las ventajas únicas de los métodos de diseño experimental en el campo de la optimización en la práctica. Este artículo comenzará sistemáticamente con ¿por qué el diseño experimental? Tres principios principales del diseño experimental, flujo de trabajo del diseño experimental, ¿por qué un experimento factorial parcial? Una breve introducción al diseño experimental en términos de superficies de respuesta y estrategias experimentales secuenciales, así como escenarios de aplicación del diseño experimental.
1. ¿Por qué diseño experimental? ——¿Búsqueda de rostros o búsqueda de líneas?
Box mencionó una vez en su obra "El camino hacia la maestría en estadística - Memorias de George Box" que "La estadística trata sobre cómo generar y utilizar datos para resolver problemas científicos". Para ello, es fundamental estar familiarizado con la ciencia y el método científico. En la investigación científica y tecnológica, a menudo necesitamos estudiar numerosas variables. También podrías llamar a aquellas variables que puedes cambiar "variables de entrada" o "factores" y aquellas que sólo puedes observar como "variables de salida" o "variables de respuesta". Alguna vez se pensó que la forma correcta de estudiar un sistema afectado por múltiples factores era cambiar un factor a la vez. Pero hace más de ochenta años, R.A. Fisher reveló al mundo que este método era demasiado ineficiente y desperdiciaba muchos esfuerzos experimentales. De hecho, se deben cambiar múltiples factores simultáneamente en lo que se llama un "diseño experimental". Sin embargo, incluso hoy en día todavía se enseña en las aulas el método de cambiar un factor a la vez. 』
Se puede ver que incluso ahora, algunos investigadores todavía están utilizando el método de cambiar un factor a la vez (también llamado COSTO, es decir, cambiar un factor separado a la vez, correspondiente al diseño experimental También se llama DOE (Diseño de experimentos) para encontrar el valor óptimo. Sin embargo, este método de cambiar solo un factor a la vez obviamente tiene deficiencias como la ineficiencia y la incapacidad de evaluar el efecto de interacción, lo que hace que sea fácil perder el valor óptimo. .
Primero podemos echar un vistazo al caso que se muestra en la Figura 1:
Después de una investigación, un equipo descubrió que el rendimiento de una reacción química de un determinado producto de su empresa está relacionado con la presión del reactor y la cantidad de adición de catalizador. Para explorar el mejor proceso, se llevaron a cabo las siguientes pruebas:
1) Se fijó la cantidad de adición de catalizador en 5 kg, se ajustó el reactor. presión y realizó varias pruebas, finalmente, se concluyó que cuando la presión del reactor es de 750 Mpa, el rendimiento es el mejor;
2) Luego, fije la presión del reactor en 750 Mpa, ajuste la cantidad de adición de catalizador y realice. varias pruebas finalmente, se concluye que la cantidad de adición de catalizador es de 3 kg y el rendimiento es el mejor;
3) Por lo tanto, el equipo de investigación cree que el reactor debe estar a 750 Mpa y la cantidad de adición de catalizador. debe ser de 3 kg para lograr el mejor rendimiento general.
Entonces, ¿los hechos coinciden con las conclusiones a las que llegó este equipo? Podemos ver claramente en el mapa de contorno obtenido mediante el diseño experimental a la derecha que el punto óptimo en realidad ocurre cuando la presión del reactor = 650 Mpa y la cantidad de adición de catalizador = 3 kg. El rendimiento en este momento será superior al 91%, y el óptimo. El rendimiento obtenido con el primer método se estima en alrededor del 90%. Se puede observar que el primer método tiene el riesgo de perder el valor óptimo. De hecho, también podemos ver en la figura anterior que el primer método es en realidad un método de búsqueda de líneas, mientras que el diseño experimental es un método de búsqueda de superficies. Obviamente, la búsqueda a través de superficies es más eficiente que la búsqueda a través de líneas. valores óptimos. Al mismo tiempo, a través del método de diseño experimental, podemos obtener superficies de respuesta muy intuitivas y gráficos de contorno entre variables de respuesta y factores, lo que puede ayudarnos a comprender mejor la ley de cambios en las variables de respuesta con factores.
2. ¿Tres principios principales del diseño experimental? - Tierras de cultivo de Fisher
A través de la primera sección anterior, entendemos por qué DOE es más eficiente que el método COST, pero cómo proceder con el diseño experimental. Es un vínculo muy importante, que afectará directamente la eficiencia y el éxito del experimento. Durante sus 14 años de trabajo en la Estación Experimental Agrícola de Lausana (1919-1933), Fisher resumió los tres principios de universalidad del diseño experimental a través de una gran cantidad de estudios experimentales, a saber:
(1) Experimentos repetidos ;
(2) Aleatorización;
(3) Bloqueo.
Sin embargo, a veces la interpretación de estos tres principios en algunos libros profesionales es muy oscura. Aquí intentamos interpretar estos tres principios desde otra perspectiva a través de una historia apócrifa: Fisher's Farmland.
Como se muestra en la Figura 2, la historia es que cuando Fisher estaba trabajando en la Estación Experimental Agrícola de Lausana, realizó una prueba de evaluación del rendimiento por acre de dos tipos de arroz después de pensarlo detenidamente. finalmente concluyó: Establecía los tres principios principales del diseño experimental y ha sido considerado un clásico por la comunidad académica:
① La idea original de Fisher era plantar semillas de arroz A y semillas de arroz B en dos campos de arroz. , y luego vaya a Ver qué tipo de arroz tiene un mayor rendimiento por mu, para que pueda sacar una conclusión de evaluación;
② Sin embargo, Fisher es un gran estadístico, así que después de pensarlo por un tiempo , piensa que es solo de uno No es riguroso hacer un juicio en un punto, por lo que dividió los campos izquierdo y derecho en 4 campos cada uno, y luego plantó A y B. De esta manera, no solo pudo obtener el rendimiento promedio por acre de los dos tipos de arroz A y B, pero también puede obtener la desviación estándar de su rendimiento por mu, lo que hace que la comparación sea más convincente
③ Sin embargo, el entusiasta Fisher; Pronto se dio cuenta de que el método experimental anterior todavía tenía fallas, porque según su propia experiencia de muchos años trabajando en estaciones experimentales agrícolas, la fertilidad del suelo en las tierras de cultivo de la estación experimental es muy desigual. la izquierda es promedio, mientras que el suelo de la tierra de cultivo de la derecha es más fértil. Si la conclusión final es que el rendimiento de la semilla de arroz B es mayor, entonces es la semilla de arroz la que causa su alto rendimiento, o es el suelo. ¿A qué se debe su alto rendimiento? Aquí había confusión entre dos factores, así que después de pensarlo, rediseñó el método experimental. Plantó A y B en las tierras de cultivo de la izquierda y la derecha respectivamente, de modo que el arroz A y B se plantarían en suelo fértil y en suelo ordinario. Todas las tierras de cultivo se plantan con igualdad de oportunidades, por lo que los resultados obtenidos al hacerlo serán más razonables;
④ Originalmente, este plan experimental podría implementarse directamente. En este momento, la Estación Experimental Agrícola recibió temporalmente A. Se requirió una nueva tarea para evaluar si la sembradora mecánica recién inventada era más útil para aumentar el rendimiento por mu que la siembra artificial. Para reducir el número de pruebas, fue necesario fusionar las dos evaluaciones. Fisher fue de hecho un genio, y. Rápidamente lo descubrió. Encontró una manera perfecta de solucionar este problema. Sembró la mitad de la tierra de cultivo a la izquierda y a la derecha manualmente, y la otra mitad mecánicamente, de esta manera completó perfectamente esta tarea temporal sin aumentar el número de. experimentos.
De hecho, en el pensamiento lógico experimental ②, ③ y ④ anteriores, Fisher ha aplicado de manera muy creativa los tres principios principales del diseño experimental de experimentos repetidos, aleatorización y bloqueo. acre de dos tipos de variedades de arroz garantiza la validez y racionalidad de los resultados de las pruebas y proporciona una fuerte garantía para los resultados finales de la evaluación científica.
Por supuesto, existe un principio básico para el bloqueo, es decir: "Aquellos que se puedan agrupar se dividirán en grupos, y aquellos que no se puedan dividir en grupos se aleatorizarán". 』
3. Flujo de trabajo del diseño y análisis experimental
Ya conocemos las ventajas del diseño experimental y los tres principios principales del diseño experimental. Aquí utilizamos un análisis factorial completo porque. del diseño, presentaremos el flujo de trabajo del diseño y análisis experimental.
Como se muestra en la Figura 3, este es un diagrama de diseño factorial típico. En la figura se puede ver que el diseñador experimental está tratando de estudiar el impacto de tres factores A, B y C en la respuesta. variable Con este fin, el diseño El autor diseñó el siguiente plan de prueba y espera estimar los coeficientes de la siguiente ecuación de regresión a través de la prueba anterior:
De la ecuación de regresión anterior, se puede ver claramente que. hay 8 coeficientes que deben estimarse. Por lo tanto, es necesario estimar al menos 8 coeficientes. De manera similar, si el número de factores es n, entonces debemos lograr una factorización completa, lo que requiere al menos 10 experimentos.
De acuerdo con los tres principios del diseño experimental mencionados anteriormente, también necesitamos realizar pruebas repetidas, pero para reducir el número de pruebas, generalmente elegimos realizar 3-4 pruebas repetidas en el punto central. . Otro beneficio de elegir realizar pruebas de repetibilidad en el punto central es que puede descubrir si hay flexión en el modelo. Si hay flexión, necesitamos agregar términos de orden superior de los factores para formar una superficie de respuesta. es decir, esto significa que básicamente hemos encontrado el valor óptimo. Por supuesto, en el caso de flexión, es necesario agregar algunos puntos de prueba para estimar los parámetros del modelo, que se analizarán más adelante. Al mismo tiempo, también necesitamos aleatorizar el orden de los experimentos. Este caso no requiere agrupación, por lo que el experimento se puede realizar directamente sobre la base de este diseño experimental y se pueden obtener los datos experimentales correspondientes.
Además, al configurar los niveles alto y bajo de los factores, asegúrese de establecer los niveles alto y bajo lo más separados posible; de lo contrario, el ruido en el experimento puede ahogar los efectos significativos originales. Además, alejar los puntos de prueba también puede ayudar a explorar ubicaciones de proceso desconocidas, como se muestra en la Figura 4.
Después de obtener los datos experimentales, es necesario iniciar el análisis del diseño experimental, que básicamente sigue el siguiente proceso:
De hecho, en el flujo de trabajo anterior, los primeros tres pasos Ya hemos introducido la regresión lineal con gran detalle. La ligera diferencia es que en este modelo de regresión, el número de factores (efectos principales) es mayor que 1 y hay términos de interacción de segundo orden. Los coeficientes se prueban para determinar si su impacto en la variable de respuesta es significativo. Al mismo tiempo, también es necesario ver si el modelo tiene flexión o falta de ajuste. Por ejemplo, vemos en los resultados del modelo que un determinado principal. El efecto no es significativo, o un determinado efecto secundario no es significativo. Si el efecto de interacción de primer orden no es significativo, debemos eliminar estos elementos y volver a ejecutar la regresión.
Cuando el modelo ha sido mejorado y no hay anomalías, puede entrar en la etapa de interpretación del modelo. En esta etapa, debemos hacer dos cosas:
(1) A través del. factor de salida Diagramas de efectos principales y diagramas de efectos de interacción para verificar y confirmar aún más su importancia;
(2) Al generar gráficos de contorno y superficies de respuesta, podemos comprender de manera más intuitiva la ley de cambios de las variables de respuesta con variables independientes , para ayudar a encontrar la mejor configuración.
A continuación, también debemos utilizar el optimizador de respuesta para encontrar la mejor configuración y determinar si el valor óptimo ha alcanzado el objetivo establecido originalmente. Si se ha alcanzado, no significa que el trabajo haya terminado. , pero es necesario realizar más pruebas de verificación. El enfoque habitual es realizar más de 3 pruebas de verificación en el punto óptimo. Por supuesto, si no se ha alcanzado el objetivo establecido originalmente, aún debemos continuar organizando las pruebas centradas en el. punto óptimo. Diseño hasta alcanzar el objetivo predeterminado.
4. ¿Por qué realizar un test factorial parcial? ——El equilibrio entre resolución y eficiencia experimental
Como se mencionó anteriormente, cuando el número de factores es n, si es necesario realizar un diseño factorial completo, se debe realizar al menos un experimento Con cálculos simples. podemos Se obtiene que cuando el número de factores llega a 5, el diseño factorial completo requiere 32 experimentos (excluyendo el punto central), y cuando el número de factores llega a 6, el diseño factorial completo requiere 64 experimentos. Tomando como ejemplo 4 factores, damos la ecuación modelo del diseño experimental de la siguiente manera:
Se puede observar que si se hace un diseño factorial completo, además de los términos constantes, existen 4 factores estimados. efectos principales, términos de efectos de interacción de segundo orden*** 6 ítems, términos de efectos de interacción de tercer orden*** 4 ítems, términos de efectos de interacción de cuarto orden*** 1 ítem, ítem de primer orden***, y entre. estos elementos, elementos de efecto de interacción de tercer orden y de tercer orden Los términos de interacción anteriores en realidad ya no tienen importancia práctica. Por lo tanto, los parámetros que realmente necesitamos inferir son solo términos constantes, términos de efecto principal y términos de efecto de interacción de segundo orden. Hay 11 términos en total. Por lo tanto, esperamos hacer menos experimentos, es posible realizar la idea de poder controlar las constantes y los coeficientes de los términos de primer y segundo orden en la ecuación del modelo. tiempo.
En el trabajo real, debido a limitaciones de recursos y tiempo, esta necesidad de eficiencia y control de costes de prueba es común. Aún tomando 4 factores (A, B, C, D) como ejemplo, un diseño factorial completo requiere 16 experimentos. En este momento, de acuerdo con las restricciones, solo se pueden realizar 8 experimentos, entonces, cómo elegir estos 8 experimentos es la forma. más razonable ¿Qué pasa? Según el análisis, se puede concluir que lo más razonable es seleccionar experimentos de acuerdo con el generador D=ABC (la relación de definición es ABCD=1, denominada "palabra"). Esto no solo garantiza la ortogonalidad del experimento. diseño, pero también garantiza el efecto principal de primer orden. El efecto no se vio confundido por el efecto de interacción de segundo orden.
En algunos experimentos factoriales, también hay situaciones en las que hay múltiples generadores (es decir, múltiples palabras. En este caso, la longitud de la palabra más corta entre todas las palabras se define como la resolución de la palabra completa). diseño (resolución), la resolución generalmente se da en números romanos, como I, II, III, IV, etc. El ejemplo anterior utiliza ABCD=1 para obtener 8 arreglos experimentales, entonces su resolución es IV. Este plan de diseño se registra como, de manera más general, el diseño factorial parcial con resolución R se registra como, donde k es el número de factores y p. es el número de generadores o palabras.
Para facilitar su uso a los investigadores, los estadísticos han compilado especialmente la tabla de resolución de experimentos de factores parciales en la Tabla 2. Al mismo tiempo, en el software minitab o jmp, el diseño de experimentos de factores parciales También se puede generar directamente a través del software.
Se puede ver en la tabla anterior que cuando se determina el número de factores, necesitamos obtener una resolución más alta, por lo que se deben realizar más experimentos. Por lo tanto, en el trabajo real, los investigadores pueden elegir según. sus propias necesidades para lograr un equilibrio entre resolución y eficiencia.
5. Método de superficie de respuesta y estrategia de prueba secuencial: selección bajo flexión
El método de superficie de respuesta (RSM) generalmente es adecuado para las siguientes situaciones:
(1 ) Cuando el número de factores es pequeño (generalmente no más de 3);
(2) Es necesario encontrar el valor máximo o mínimo de la variable de respuesta.
En el diseño experimental, el método de la superficie de respuesta generalmente ocurre cuando se encuentra un fenómeno de flexión durante un experimento factorial completo después de seleccionar factores. En este momento, la estrategia que debe adoptarse es agregar coeficientes cuadráticos al método. modelo La ecuación de regresión del término, tomando 2 niveles como ejemplo, el modelo general se puede expresar como:
Obviamente, los parámetros que deben estimarse se incrementan en 2 en este momento (el coeficiente. del término cuadrado del factor), entonces los puntos de prueba originales no son suficientes. Es necesario agregar algunos puntos de prueba y estimar los parámetros relevantes mediante regresión lineal. En este momento, la forma más eficiente es utilizar una estrategia de prueba secuencial para aumentar los puntos de prueba. La Figura 6 muestra dos métodos de diseño compuesto centrales que mantienen la secuencia. Por supuesto, el diseño de superficies de respuesta también incluye otros tipos de métodos, pero no tienen las características de mantener la secuencia, como el diseño acotado compuesto central (CCI) y el diseño Box-Behnken.
Después de agregar puntos de prueba, se puede realizar el análisis de la superficie de respuesta. El proceso de análisis es básicamente similar al proceso de análisis del diseño experimental antes mencionado y no se describirá nuevamente aquí.
6. Introducción a los escenarios de aplicación del diseño experimental en sitios industriales
Como herramienta de optimización eficiente, el diseño experimental se utiliza ampliamente en diversas industrias, especialmente en la industria química. Los métodos de diseño experimental adoptados se utilizan para mejorar la eficiencia del diseño y desarrollo de la formulación de productos, mejorar la eficiencia de la producción, aumentar el rendimiento del producto, etc. Además, el uso del diseño experimental para mejorar la confiabilidad del producto y la solidez del proceso ha logrado un gran éxito en muchas industrias.
A la hora de realizar un diseño experimental, el pensamiento estadístico y la pericia y experiencia del investigador (conocimiento no estadístico) son muy importantes para el éxito del experimento. Sin embargo, al realizar alguna investigación exploratoria, debido a la menor acumulación de conocimiento y experiencia, la cantidad de factores que deben evaluarse aumentará repentinamente. De la discusión anterior, podemos saber que cuando la cantidad de factores aumenta, la cantidad de experimentos. el diseño factorial completo aumentará. Con un crecimiento exponencial, incluso para las pruebas de factores parciales, el número de pruebas seguirá siendo muy grande, por lo que para las empresas causará una mayor presión sobre los costos de I + D y afectará la eficiencia de la I + D. En un proyecto de cooperación entre Guogong Intelligence y el Instituto de Investigación Wanhua nacional, los expertos en ciencia de datos de Guogong Intelligence utilizaron algoritmos de optimización bayesianos para reducir el trabajo de optimización que originalmente requería 150 pruebas a solo 3 juegos de ruedas** *El mismo efecto se puede lograr con 15 experimentos Sin embargo, es innegable que el método de diseño experimental tiene una mejor interpretabilidad del modelo que el algoritmo de aprendizaje automático, lo cual es crucial para que los investigadores realicen más estudios de mecanismos. Al mismo tiempo, incluso los algoritmos de inteligencia artificial necesitan el apoyo de puntos de datos obtenidos de. Diseño experimental preliminar para una mayor optimización y arreglos experimentales.
En general, el diseño experimental sigue siendo la herramienta de optimización más importante en los campos químico y farmacéutico. Como líder en el campo del control de la toma de decisiones mediante inteligencia artificial en los campos químico y farmacéutico, Guogong Intelligence siempre ha otorgado gran importancia al desarrollo y aplicación de varios algoritmos de modelos estadísticos. Actualmente, su plataforma de cerebro de datos ha integrado cientos de estadísticas y. algoritmos de aprendizaje automático, y se ha utilizado ampliamente en las industrias química, farmacéutica y otras, creando un enorme valor comercial para muchas empresas nacionales.
Referencias:
[1]. "Estadísticas", [EE.UU.] William M. Mendenhall et al.
[2]. of Experiments", [EE.UU.] Douglas C. Montgomery
[3]. "El camino hacia la maestría en estadística - Memorias de George Box", [Reino Unido] George E.P. Box
[4]. "Guía estadística de gestión Six Sigma", espera Ma Fengshi
[5] Una breve introducción al diseño de experimentos, [EE.UU.] Jacqueline K. Telford.