HKUST iFlytek Super Brain Translation

Cabe decir que las perspectivas de los hogares inteligentes han experimentado tres oleadas de altibajos en los 60 años de desarrollo de la inteligencia artificial. A partir de la Conferencia de Dartmouth, la gente inventó sucesivamente el primer software de red neuronal perceptual y software de chat, demostrando teoremas matemáticos. En ese momento, todos exclamaron: "La inteligencia artificial está llegando y las máquinas superarán a los humanos en diez años". Sin embargo, a finales de la década de 1970, la gente descubrió que las teorías y modelos anteriores sólo podían resolver algunos problemas muy simples, y la inteligencia artificial entró rápidamente en su primer invierno.

Con la introducción de la red neuronal Hopfield y el algoritmo de entrenamiento BT en 1982, descubrimos que la primavera de la inteligencia artificial está llegando nuevamente. En la década de 1980, hubo otro auge de la inteligencia artificial, incluido el reconocimiento de voz, proyectos de traducción de voz y la computadora de quinta generación propuesta por Japón. Sin embargo, a finales de los años 1990, la gente descubrió que este tipo de cosas estaban muy lejos de nuestra vida real. La impresión de todos es que IBM lanzó un software de dictado de voz llamado IBM Viavoice en los años 1990. Funciona bien en demostraciones, pero es difícil de utilizar en la práctica. Entonces, la segunda ola de IA colapsó alrededor del año 2000. Luego vino la tercera ola de inteligencia artificial, la tecnología de aprendizaje profundo de Hinton propuesta en 2006, y algunos éxitos en áreas como el reconocimiento de imágenes y voz. Todo el mundo cree que después de dos grandes altibajos, la inteligencia artificial está en vísperas de su verdadera explosión.

Tres armas mágicas para el éxito de la inteligencia artificial industrial

En la tercera ola de inteligencia artificial de la última década, la industria ha logrado algunos avances. En primer lugar, los modelos y algoritmos de las redes neuronales profundas son esencialmente diferentes de los métodos tradicionales. Si bien tiene muchas deficiencias en comparación con nuestras redes neuronales humanas, tiene sus puntos fuertes en términos de arquitectura y descripción. En segundo lugar, los grandes datos. Con el rápido desarrollo de Internet móvil, los datos crecen exponencialmente todos los días. A través de teléfonos móviles y WeChat, las personas pueden transmitir fácilmente estos datos visuales y auditivos a Internet en cualquier momento y en cualquier lugar, y agregarlos para formar big data. En tercer lugar, el efecto dominó. Con el desarrollo de Internet móvil, el umbral para que diversos software y dispositivos lleguen a los usuarios se ha reducido considerablemente. Por ejemplo, cuando una nueva aplicación encuentra sus primeros usuarios, sus comportamientos y registros de uso se registran en segundo plano y los desarrolladores mejoran iterativamente este comportamiento y registros. Cuando la aplicación se coloca en el segundo grupo de usuarios, el comportamiento del software mejora en comparación con la primera generación. Esta es una reacción en cadena. A medida que las oleadas de iteraciones crezcan, el software se volverá más útil e inteligente.

El efecto dominó promueve el desarrollo del reconocimiento de voz y de imágenes.

La practicidad del reconocimiento de voz se beneficia del "efecto dominó". Cuando se lanzó el reconocimiento de voz de iFlytek en 2010, francamente, la tasa de reconocimiento era sólo del 60%. Al principio todos pensaron que no era fácil de usar, pero hubo un grupo de personas que lo probaron. Con la iteración continua de tecnología y datos, la tasa de reconocimiento de voz de iFlytek ha alcanzado ahora más del 95%, alcanzando un estado completamente práctico. Lo mismo ocurre con el reconocimiento de imágenes. En la tarea de reconocimiento de imágenes de ImageNet, la tasa de error llegó al 26,2% en 2012, pero había caído al 3,57% a finales de 2015. Básicamente, podemos decir que esta tecnología nos permite distinguir fácilmente varios objetos de nuestro hogar con una sola cámara.

Además, con el auge del aprendizaje profundo en los últimos dos años, se han establecido diversas aplicaciones en diversas industrias. El evento más influyente recientemente fue la victoria del robot de Google AlphaGO por 4-1 sobre el campeón mundial de Go Lee Sedol el 15 de marzo. AlphaGO también utiliza modelos de aprendizaje profundo para evaluar la situación, recopila las características de 30 millones de registros de ajedrez y finalmente forma un plan integral. Alcanzando así el nivel más alto de los seres humanos en el juego relativamente fijo del Go. Después de revisar tantos desarrollos y oleadas de inteligencia artificial, en retrospectiva, la inteligencia artificial que hacemos sigue siendo del 1 al N, es decir, "inteligencia artificial débil".

Revolución cognitiva utilizando la voz y el lenguaje como entrada

Entonces, ¿qué es la "inteligencia artificial fuerte"? De hecho, cuando una computadora puede aprender automáticamente conocimientos de Internet, aprender e incluso pensar sin supervisión, se le puede llamar "inteligencia artificial fuerte". Si desea lograr un gran avance en la "inteligencia artificial fuerte", ¿dónde puede inspirarse? La humanidad ha experimentado la revolución agrícola, la revolución industrial y la revolución de la información desde hace 2 millones de años, pero antes de eso hubo en realidad una revolución clave: la revolución cognitiva. Hace unos 70.000 años, un grupo de personas realizó cambios revolucionarios que aceleraron todo el ciclo de iteraciones evolutivas.

La razón de la revolución cognitiva es que estas personas de repente hablaron e inventaron el lenguaje hace 70.000 años. El uso generalizado del lenguaje puede expresar información muy compleja; con el lenguaje, podemos retroalimentar información social y organizarnos en grupos más cohesivos y más grandes, podemos transmitir algunos conceptos imaginarios o abstractos; Con esta idea, un gran número de desconocidos pueden colaborar para innovar, y esa es la importancia del lenguaje.

Por el contrario, ¿qué debemos hacer si la máquina cambia de "inteligencia artificial débil" a "inteligencia artificial fuerte"? También necesitamos una revolución cognitiva. Porque muchos conocimientos y habilidades están registrados en el lenguaje humano, texto, bases de conocimiento, redes y diversas instrucciones. Si la inteligencia artificial quiere abrirse paso y lograr una evolución más larga, también necesita una revolución cognitiva para aprender este conocimiento.

Rompiendo el desarrollo de las habilidades cognitivas de la inteligencia artificial

Ahora la industria básicamente divide la inteligencia artificial en tres etapas: inteligencia computacional, inteligencia perceptiva e inteligencia cognitiva. La inteligencia computacional se refiere a la comparación del almacenamiento y la memoria entre computadoras y humanos, y ha superado con creces a los humanos en este sentido. Pero a nivel perceptivo, las computadoras todavía tienen muchas deficiencias en términos de reconocimiento de voz, reconocimiento de imágenes y otros aspectos de la verdadera comprensión, pensamiento y aprendizaje autónomo. El 20 de agosto de 2014, iFlytek lanzó el proyecto iFlytek Super Brain. Ahora deberíamos poder escuchar, hablar, comprender y pensar. La voz no solo percibe el mundo a través de sensores y algoritmos, sino que también puede comprender verdaderamente las necesidades, comportamientos y lenguajes de algunos usuarios antes que la cognición. De hecho, la inteligencia cognitiva no se trata simplemente de realizar un trabajo básico. Se ha descubierto que cuando las personas comprenden el mundo, en realidad combinan percepción y cognición. Cuando escuchamos algunas palabras con nuestros oídos, no sólo escuchamos los cálculos en nuestro cerebro y entendemos el significado de las palabras, sino que también desarrollamos nuestras habilidades cognitivas, lo que a su vez puede facilitar el progreso en tareas básicas como el reconocimiento de voz.

La industria de TI ha experimentado cinco oleadas desde la década de 1960 hasta el presente, y hemos entrado en la era del Internet de todo. En un estado sin pantallas, móvil y de campo lejano, se acerca la era de la interacción entre humanos y computadoras, con la voz como componente principal y el teclado y el tacto como complementos. Por lo tanto, iFlytek lanzó oficialmente la interfaz de interacción hombre-computadora AIUI el 21 de febrero de 2015 para definir el estándar de interacción persona-computadora en una era de Internet de todo. Su propósito es hacer que la interacción hombre-máquina sea más natural y conveniente. Puede lograr recopilación con un solo clic, audiciones de múltiples conjuntos de micrófonos, cálculo y desarrollo sencillos con SDK, adaptación profunda a la nube y servicios exclusivos y considerados, lo que en última instancia permite que los hogares inteligentes interactúen con las personas.

Usar la inteligencia artificial para cambiar el mundo juntos

Basándonos en esta tecnología, hemos creado una plataforma de desarrollo de inteligencia artificial y podemos ver que nuestros socios y servicios están aumentando muy rápidamente. Esta ola de inteligencia artificial está llegando más rápido de lo esperado. Según un informe de investigación de McKinsey, el 45% de las actividades se pueden automatizar utilizando la tecnología actual. No sólo se automatizarán los trabajos con salarios bajos, sino también una parte considerable de las actividades diarias en los trabajos con salarios altos. Quizás en tres a cinco años, muchas industrias realmente puedan mejorar a través de la tecnología de inteligencia artificial. Masayoshi Son, presidente del SoftBank de Japón, definió la ecuación de la resurrección como “productividad × fuerza laboral = competitividad”. Como todos sabemos, después de más de 30 años de planificación familiar en China, la población activa ha seguido una tendencia a la baja. ¿Qué hacer a continuación? Si mantenemos nuestra competitividad, en realidad deberíamos utilizar más máquinas para aumentar nuestra producción total. "En el futuro, los robots industriales determinarán el ranking mundial del PIB" no es una afirmación vacía. Nuestra visión es trabajar con usted para utilizar la inteligencia artificial para cambiar el mundo y mejorar nuestra competitividad nacional.