¡El chico chino de 27 años se hizo famoso en una batalla! Saque el modelo de predicción más preciso del nuevo coronavirus en Estados Unidos y revise únicamente las instituciones profesionales.
A la edad de 27 años, Bloomberg lo evaluó como? ¿Superestrella de los datos de COVID-19? .
¿Por qué?
Los modelos de predicción de COVID-19 creados en una semana superan a las instituciones profesionales con miles de millones de dólares y décadas de experiencia en precisión.
Él es Youyang Gu, que tiene una maestría en ingeniería eléctrica e informática y una licenciatura en matemáticas del MIT.
Pero cabe señalar que es un novato en medicina y epidemiología.
Su modelo ha sido muy elogiado incluso por Jeremy Howard, famoso científico de datos y fundador de fast.ai:
El único modelo razonable.
Él fue el único que realmente miró los datos y lo hizo bien.
No sólo eso, su modelo fue adoptado por los Centros para el Control y la Prevención de Enfermedades de Estados Unidos.
¿Qué tipo de modelo de predicción es?
El tiempo se remonta a principios del año pasado.
En ese momento, la epidemia ya se estaba extendiendo por todo el mundo, por lo que el público intentó predecir el impacto de la próxima epidemia mediante modelos.
La mayoría de la gente ha centrado su atención en el sistema de predicción establecido por dos organizaciones profesionales, el Imperial College de Londres y el Instituto de Medición y Evaluación de la Salud (IHME) de Seattle.
Sin embargo, las predicciones de ambas instituciones son muy diferentes:
Imperial College London, Londres: El número de muertes por COVID-19 en Estados Unidos alcanzará los 2 millones en el verano.
IHME: Se estima que para agosto la cifra de muertos llegará a 60.000.
(Más tarde se demostró que el número de muertos era de 16.000.)
¿Por qué son tan diferentes las previsiones de las dos organizaciones profesionales?
Esto llamó la atención de You Yanggu, quien en ese momento solo tenía 26 años.
Aunque no tiene experiencia en medicina ni epidemiología, cree firmemente que la predicción de datos será de gran utilidad en este momento.
Entonces, a mediados de abril, Gu Youyang se quedó en casa durante una semana y creó su propio predictor y un sitio web que podía mostrar información relevante.
Pero el método que Gu utilizó en este proceso no es tan avanzado. Al contrario, es relativamente simple.
Primero consideró la relación entre el número de pruebas de COVID-19, el número de hospitalizaciones y otros factores, pero en el proceso, Gu descubrió que los datos proporcionados por los gobiernos estatales y federal eran inconsistentes.
Llegado a este punto, la pregunta es ¿qué tipo de datos son confiables?
Gu cree que los datos más fiables parecen ser las muertes diarias:
Otros modelos utilizan muchas fuentes de datos, pero yo decidí utilizar muertes pasadas para predecir muertes futuras.
En cuanto al motivo de esto, ¿cuál es la explicación de Gu? ¿Tenerlo como única entrada ayuda a filtrar la señal del ruido? .
Entonces, ¿cuál es el resultado previsto?
Se puede decir que es bastante exacto.
Cuando se completó el modelo por primera vez, predijo que 80.000 personas morirían en Estados Unidos el 9 de mayo, pero el número real de muertes ese día fue 79.926.
¿Los mismos datos de previsión del IHME? ¿El número de muertes en 2020 no superará las 80.000? .
Gu también predijo que el 18 de mayo, el número de muertos llegaría a 90.000; el 27 de mayo, el número de muertos alcanzaría más de 654,38 millones.
¿Los hechos han demostrado que sus dos predicciones son ciertas? ¿apuesta? !
Aparte de las cifras exactas, Gu predice que se producirá una segunda ola de infecciones y muertes a gran escala basada en el cambio gradual del confinamiento a la apertura en muchos países.
¿Qué dijo Trump el día que Gu hizo esta predicción? ¿La previsión del IHME de 60.000 muertes sugiere que la pandemia terminará pronto?
Quizás sea debido a las precisas predicciones de Gu que cada vez más personas prestan atención a sus obras.
En Twitter, Gu no solo contactó a los periodistas sino que también envió correos electrónicos a los epidemiólogos, pidiéndoles que verificaran sus datos.
A finales de abril del año pasado, Carl Bergström, un famoso biólogo de la Universidad de Washington, publicó el modelo de Gu en Twitter.
Poco después, los Centros para el Control y la Prevención de Enfermedades de EE. UU. también publicaron los datos de Gu en su sitio web de pronósticos.
Y a medida que avanza la epidemia, Gu, un inmigrante de China, también participó en reuniones periódicas organizadas por el equipo de expertos estadounidenses, y todos querían mejorar su modelo.
El tráfico de su sitio web también se ha disparado: millones de personas ven sus datos cada día.
Normalmente, el modelo de Gu predice datos que se alcanzan en unas semanas y que están muy cerca del número de muertos real.
A medida que el número de modelos predictivos similares aumenta gradualmente, Nicholas Reich, profesor asociado en el Departamento de Bioestadística y Epidemiología de la Universidad de Massachusetts en Amherst, cuenta 50 de estos modelos:
Gu El modelo siempre ha estado a la vanguardia.
Pero el 11 de junio del año pasado, Gu tomó una decisión inesperada y puso fin a su misión de pronóstico.
Al respecto, Reich comentó:
Gu es una persona muy humilde. Cuando ve que a los modelos de otras personas les va bien, siente que su trabajo está hecho.
Un mes antes de que Gu decidiera detener el proyecto, predijo que el número de muertos el 11 de junio llegaría a 231.000, mientras que el número real era 230.995.
Pero Chris Murray de IHME cree:
El método de aprendizaje automático utilizado por Gu es eficaz en la predicción a corto plazo, pero no se comprende muy bien. ¿Qué está pasando en el panorama general? .
En este sentido, Gu no respondió a su evaluación del modelo. En cambio, afirmó lo siguiente:
Estoy extremadamente agradecido por el trabajo del Dr. Chris Murray y su equipo; sin ellos, no estaría donde estoy hoy.
Después de tomarse un descanso, Gu volvió a esta carrera.
¿Cuál es su predicción esta vez? ¿Cuántas personas en Estados Unidos han sido infectadas con el coronavirus? ,?¿Con qué rapidez se introducirá la vacuna? ¿Cuándo (si es posible) Estados Unidos logrará la inmunidad colectiva? etc.
Sus proyecciones muestran que para junio de este año, alrededor del 61% de la población estadounidense debería tener algún tipo de inmunidad, ya sea por una vacuna o por una infección pasada.
Gu siempre había querido encontrar un trabajo en el que pudiera tener un impacto significativo en la sociedad y al mismo tiempo evitar la política, los prejuicios y las cargas que a veces conllevan las grandes instituciones. Él cree:
En este campo, hay muchas deficiencias que las personas con mi experiencia pueden mejorar.
¿Quién es Gu Youyang?
Gu Youyang proviene de una familia de inmigrantes chinos en Estados Unidos y creció en Illinois y California.
A Gu le gustaron las matemáticas y las ciencias desde que era niño, pero no entró realmente en contacto con la informática hasta que se graduó en el instituto. Y pudo ingresar a esta industria gracias a su padre, que era informático.
Tanto Gu como Master asistieron al MIT, donde obtuvo una doble licenciatura en informática y matemáticas, y una maestría en informática.
Después de graduarme, continué estudiando en el grupo de PNL del famoso laboratorio CSAIL del MIT durante un año y publiqué un artículo en EMNLP 2016 ese mismo año.
Este también fue su primer contacto con big data y construyó un modelo estadístico para predecir los datos.
Pero no continuó la investigación académica, sino que incursionó en la industria. Después de dejar el MIT, se unió a la industria financiera, escribiendo algoritmos para sistemas comerciales de alta frecuencia.
Allí perfeccionó aún más sus habilidades de modelado de datos, porque en el comercio financiero los datos deben ser muy cuantitativos y lo más precisos posible.
Después se adentró en el mundo del deporte y continuó con la investigación en big data. Esto también le ha proporcionado una gran experiencia interdisciplinaria, lo que le ha permitido abordar con éxito nuevas áreas y saber modelar con mayor precisión.
En sus propias palabras, su experiencia es utilizar el aprendizaje automático para comprender datos, separar señales del ruido y hacer predicciones precisas.
Al modelar las muertes por COVID-19, inicialmente consideró la relación entre el número de casos confirmados, hospitalizaciones y otros factores. Luego descubrió que había inconsistencias en los datos reportados por los estados y el gobierno federal, siendo la cifra más confiable las muertes diarias.
Gu cree que si la calidad de los datos de entrada es baja, cuantos más datos haya, peor será el rendimiento de salida.
En el transcurso de una semana, construyó un modelo simple basado en datos de muerte y puso el sitio web de predicción en línea.
Desde abril del año pasado, Gu ha invertido voluntariamente miles de horas en este proyecto, de forma gratuita.
En una entrevista con Eric Schmidt, editor en jefe del sitio web médico Medscape, Gu dijo que ahora trabaja a tiempo completo en el sitio web de predicciones, no tiene trabajo a tiempo parcial, no tiene ingresos y vive de sus ahorros pasados.
Sin embargo, algunos usuarios de Twitter criticaron tales proyectos de bienestar público, pero él persistió.
Desde 65438+2 meses, proyecto 19 de neumonía por coronavirus. com ha recibido donaciones de internautas y ahora ha completado su objetivo de recaudación de fondos de 50.000 dólares estadounidenses.
Además del número de infecciones, el sitio web de Gu también tiene una nueva característica. Desde junio 65438+2 del año pasado, covid19-projections.com ha estado rastreando y modelando el estado de vacunación y el camino hacia la inmunidad colectiva.
¿Qué pasará con Gu este mes? ¿Inmunidad colectiva? ¿Cambió? ¿Volver a la normalidad? Porque las predicciones de su modelo muestran que es poco probable que Estados Unidos alcance la inmunidad colectiva teórica en 2021.
¿Qué debo hacer a continuación? ¿Cuál es su plan de carrera después de la epidemia?
Aún es demasiado pronto, afirmó. Aunque su trabajo actual es predecir el desarrollo de la epidemia, le resulta difícil predecir qué hará dentro de tres meses o dentro de un año.
Gracias a este trabajo, universidades y empresas de todo el mundo le han ofrecido una rama de olivo.