¿Qué tipo de pensamiento de inteligencia artificial refleja la prueba de inteligencia?

¿Qué es la prueba de Turing?

En un famoso artículo "Computational Machinery and Intelligence" publicado en 1950, el matemático Alan Turing discutió en detalle la pregunta "¿Pueden las máquinas tener inteligencia?" Curiosamente, como pionero en los campos de la informática y la inteligencia artificial, Turing definió con éxito qué es una máquina, pero no pudo definir qué es la inteligencia. Para ello, Turing diseñó un experimento llamado prueba de Turing. La idea central de la prueba de Turing es exigir que la computadora acepte interrogatorios humanos sin contacto físico directo y pretenda ser un humano tanto como sea posible. Consideramos que la computadora ha pasado la prueba de Turing si "suficientes" interrogadores no pueden distinguir con una precisión "suficientemente alta" si el entrevistado es una máquina o un ser humano durante "un período de tiempo suficiente". Turing consideró la prueba que diseñó como una condición suficiente para la inteligencia artificial y abogó por que las computadoras que pasaran la prueba de Turing deberían considerarse inteligentes.

En términos de informática, Turing definió el test de Turing en su artículo original [2]:

"Llamamos al siguiente problema el "juego de imitación". Los participantes en el juego incluyen un hombre, una mujer y un interrogador de ambos sexos. El interrogador permanece en una habitación separada de las otras dos personas y se comunica con ellos escribiendo a máquina, asegurándose de que el interrogador no pueda distinguirlos por sus voces y su escritura. X e Y respectivamente. El interrogador solo sabe de antemano que solo hay una mujer entre X e Y, y el objetivo de la investigación es distinguir correctamente cuál de X e Y es mujer. El objetivo del entrevistador es intentar hacer la pregunta. El entrevistado piensa que es una mujer. En otras palabras, el entrevistador debe fingir ser una mujer y la entrevistadora debe trabajar duro para demostrar su valía. Ahora preguntemos: ¿Qué pasa si el entrevistado en el juego de imitación lo es? ¿Si cambia a una computadora, la computadora hará que el interrogador sea más propenso a juzgar mal?"

Hay varios detalles que vale la pena señalar y que determinan en gran medida el resultado de la efectividad de la prueba de Turing.

(1) En primer lugar, la conversación diaria entre el interrogador y el encuestado en la prueba de Turing no es ordinaria. La pregunta del interrogador es sobre la identidad. En este caso, el interrogador generalmente no pasará tiempo charlando o charlando, sino que irá directo al grano y dirá: "Para demostrar su identidad, coopere conmigo respondiendo las siguientes preguntas...". De hecho, los chatbots en línea actuales a veces confunden verdad con falsedad, adoptando a menudo estrategias que intentan dirigir la conversación hacia temas no discriminatorios (como “háblame de ti”) sin el conocimiento del usuario.

(2) En segundo lugar, es esencial que los encuestados humanos participen en la prueba de Turing. Ella existe para evitar que las computadoras adopten estrategias de "autoautenticación negativa", como negarse a responder preguntas directamente o evitar responder preguntas irrelevantes, como una persona verdaderamente poco cooperativa. En este caso, otro entrevistado humano que testifique activamente puede garantizar que el interrogador siempre tenga suficiente información para emitir un juicio. Una situación similar se aplica cuando las computadoras intentan imitar a "humanos especiales", como niños pequeños o pacientes delirantes.

(3) Además, el principio del test de Turing es que el método interactivo de interrogatorio en sí no puede revelar las características físicas del entrevistado. En la época de Turing, esto sólo se podía lograr casi en su totalidad a través del lenguaje natural basado en texto, por lo que Turing limitó la comunicación entre las dos partes a escribir. Pero con el desarrollo actual de la tecnología multimedia, el "contenido virtual" como vídeo, audio e imágenes se puede presentar a través de computadoras en forma de contacto no físico (¡por supuesto, esto era algo que Turing no podría haber predicho hace 60 años!). . Por lo tanto, permitir que los interrogadores utilicen contenido multimedia como material de apoyo para hacer preguntas (como "Por favor, dígame cuál es el chiste en este vídeo") parece ser una adición natural y razonable a la definición original de la Prueba de Turing.

(4) Finalmente, la prueba de Turing, tal como se entiende comúnmente hoy en día, ya no distingue estrictamente el género de los participantes humanos. Normalmente, permitimos que los encuestados humanos sean de cualquier género, y el objetivo del interrogador es identificar qué encuestado es humano.

Además, para completar una prueba de Turing específica, es necesario prestar atención a muchos detalles operativos, como cuántas personas participan en la prueba para ser consideradas "suficientes", cuánto tiempo se considera el interrogatorio " "el tiempo suficiente", y qué tan alto La tasa de precisión del reconocimiento se considera "suficientemente alta", cómo seleccionar interrogadores humanos e interrogadores para representar las capacidades de reconocimiento y autocertificación de los "seres humanos", etc. Debido a la enorme influencia de la prueba de Turing, la gente ha estado tratando de desafiarla durante décadas, y de vez en cuando habrá noticias de que "un programa de computadora pasó con éxito la prueba de Turing". Creo que deberíamos ser extremadamente cautelosos con los experimentos de gran alcance. Sólo después de examinar cuidadosamente lo anterior y otros detalles importantes podremos emitir un juicio correcto sobre la validez de los resultados. Deberían evitarse en la medida de lo posible farsas como el experimento de la luz más rápida que la luz de hace unos años.

¿Cuál es la relación entre el test de Turing y la inteligencia artificial?

¿Qué significaría si un día la máquina realmente pasara la prueba de Turing? Esta pregunta involucra la relación entre la prueba de Turing y la inteligencia artificial. De hecho, casi todos los libros sobre inteligencia artificial hablarán sobre la prueba de Turing, pero una cosa que a menudo se malinterpreta es que la prueba de Turing se propone como una condición suficiente para la inteligencia artificial. Nunca ha intentado definir una categoría de inteligencia. Turing escribió muy claramente en su artículo:

"¿Pueden las máquinas ser inteligentes? Para responder a esta pregunta, primero tenemos que definir 'máquina' e 'inteligencia'. Una posibilidad es seguir la mayoría Para definir estos dos conceptos Según el entendimiento diario de la gente común, pero es peligroso hacerlo... No pretendo definir estos dos conceptos aquí. Pasemos a otra pregunta, que está estrechamente relacionada con la pregunta original y puede expresarse. Más claramente...(Descripción de la prueba de Turing)...Algunos pueden decir que esta prueba es demasiado estricta para las máquinas; después de todo, los humanos no pueden pretender ser máquinas y solo pueden pasar operaciones de inspección con velocidad y precisión. ¿No puede una máquina que se considera inteligente ser diferente de un humano? Esta es una fuerte objeción, pero al menos en cualquier caso, si tenemos la capacidad de construir una máquina que pueda pasar la prueba con éxito, no hay necesidad de preocuparse. sobre esta objeción."

Figura 1: La relación entre el comportamiento inteligente y el comportamiento humano

Con el concepto de conjuntos, nos resulta más fácil entender la prueba de Turing y la inteligencia artificial. relación. Como se muestra en la Figura 1, el conjunto correspondiente a "todos los comportamientos inteligentes" y el conjunto correspondiente a "todos los comportamientos humanos" se superponen y son diferentes. Hay algunos comportamientos inteligentes que los humanos no pueden realizar (como calcular si las blancas ganarán), pero los humanos se consideran inteligentes de todos modos, por lo que si pueden alcanzar "niveles humanos" en todos los aspectos, es decir, completar dos La intersección de conjuntos debería ser considerado "inteligente". Por otro lado, el comportamiento humano no siempre está relacionado con la inteligencia. La prueba de Turing requiere que la máquina simule completamente "todos los comportamientos humanos", incluida la intersección de dos conjuntos y los comportamientos humanos "no inteligentes". Por lo tanto, pasar la prueba de Turing es una condición eficaz y suficiente para "poseer inteligencia".

El propio Turing se mostró bastante optimista en cuanto a que la máquina podría pasar la prueba. Predijo audazmente que "para el año 2000, una computadora con 1 GB de memoria o tamaño similar permitirá que la tasa de juicio correcto de una persona promedio no supere el 70% después de haber sido interrogada durante 5 minutos". Sin embargo, a día de hoy, 2014, no se considera que ni una sola máquina haya superado el test de Turing. Curiosamente, este fallo nos lleva a una aplicación familiar: los CAPTCHA gráficos. (¡Cada vez que ingresas un código de verificación, es una prueba de Turing!)

El lento progreso de la prueba de Turing está relacionado con el poco entusiasmo de la comunidad de inteligencia artificial por la investigación sobre la “condición suficiente” de Turing. prueba. [5] Esto se debe en parte a los diferentes objetivos que persiguen la investigación convencional en inteligencia artificial y la prueba de Turing, y también porque la prueba de Turing en sí es difícil. Analicemos más a fondo las similitudes y diferencias entre la Prueba de Turing y la inteligencia artificial a través de tres características importantes de la investigación en inteligencia artificial, y por qué es poco probable que la Prueba de Turing se resuelva pronto.

En primer lugar, la investigación convencional sobre inteligencia artificial se centra en el comportamiento externo del agente, en lugar del proceso interno que produce este comportamiento.

En este sentido, la idea del test de Turing es completamente coherente con la inteligencia artificial. Centrarse únicamente en el comportamiento externo es típico del estilo funcionalista/conductista.

De hecho, aquí es donde el mundo exterior suele criticar la inteligencia artificial. Una definición estricta de "pensamiento subjetivo" requiere que el agente sea consciente de sí mismo. Pero, para empezar, estrictamente hablando, no estamos realmente seguros de que exista evidencia objetiva de la existencia de la "conciencia". Es más, se descubrió que el comportamiento inteligente y el pensamiento subjetivo pueden considerarse dos problemas separados y no necesariamente entrelazados. En concreto, se puede demostrar matemáticamente que el comportamiento de cualquier ordenador digital se puede simular mecánicamente consultando tablas. Supongamos que realmente construimos una máquina A consciente, siempre podemos dejar que otra máquina B simule mecánicamente el funcionamiento interno de A consultando tablas. La pregunta es si B es consciente. Si cada máquina consciente pudiera ser simulada por una máquina con una tabla de consulta mecánica como B, entonces no tendríamos forma de saber si una máquina realmente piensa internamente o simplemente simula el proceso de pensar a través de un comportamiento externo. [6] Por lo tanto, si tiene conciencia se ha convertido en una "otra cuestión" relativamente independiente desde una perspectiva conductista. Al mismo tiempo, "una máquina consciente siempre puede ser simulada por una máquina inconsciente" también muestra que "poseer conciencia" no puede aportar "capacidades de comportamiento" adicionales a la máquina, lo que reduce aún más la importancia de "poseer conciencia" a los ojos de conductistas. sexo.

Basándose en la independencia entre el comportamiento externo y el pensamiento subjetivo, la investigación convencional sobre inteligencia artificial y la prueba de Turing toman la realización del comportamiento externo como el único objetivo. Esta visión se denomina visión de inteligencia artificial débil. Sabemos que la investigación en todas las disciplinas se basa en un "supuesto básico". Por ejemplo, el supuesto básico que sustenta la investigación física es que "todo está sujeto a un conjunto de leyes universales y eternas". El propósito de la investigación física es "sólo" descubrir cuál es este conjunto de leyes. De manera similar, la "hipótesis de la IA débil" sostiene que una computadora bien diseñada puede exhibir un comportamiento inteligente externo que no es inferior al nivel de inteligencia humana. Se puede decir que la investigación convencional sobre inteligencia artificial se basa en el supuesto de una inteligencia artificial débil y estudia cómo implementar dicha computadora.

Figura 3: Máquina de "tabla de búsqueda mecánica": experimento de la "habitación china" de Schiller

En segundo lugar, el enfoque de la investigación convencional sobre inteligencia artificial es cómo simular la actividad de inteligencia pura humana, en lugar de toda actividad mental.

Como se mencionó anteriormente, los procesos psicológicos humanos incluyen no sólo la inteligencia, sino también una serie de "características no intelectuales" como la emoción, la capacidad estética, los defectos de personalidad y los hábitos sociales y culturales. Debido a que el Test de Turing imita a la gente común, de hecho sus requisitos para estas características no intelectuales pueden ser incluso más altos que los requisitos para la inteligencia pura: como persona común, puede que no sepa nada sobre ajedrez, pero es poco probable que pueda saberlo. No se lo digas al chico guapo/bello de la foto.

Por supuesto, la introducción de "características no inteligentes" en sí misma no impide que la prueba de Turing se convierta en una condición efectiva y suficiente, pero a menos que asumamos que todas estas "características no inteligentes" son inevitables producto de tener inteligencia; de lo contrario, tenemos que admitir que la prueba de Turing agrega demasiados factores desafiantes pero menos relevantes al problema central de la inteligencia de las máquinas. Como escribe el clásico libro de texto "Inteligencia artificial", "El campo de la aviación se esfuerza por construir aviones con buen rendimiento, en lugar de hacerlos volar como palomas para engañar a otras palomas. La investigación en inteligencia artificial debería prestar más atención a las abstracciones relacionadas con la inteligencia artificial". actividades intelectuales Funciones y principios generales.

En tercer lugar, el objetivo final de la inteligencia artificial es un agente único que pueda adaptarse completamente al "entorno humano", en lugar de un algoritmo que resuelva problemas matemáticos específicos.

En este punto, el objetivo final de la Prueba de Turing y la investigación sobre inteligencia artificial es consistente, pero el nivel actual de inteligencia artificial aún está lejos de este objetivo. De hecho, la "simulación integral de las actividades intelectuales humanas" es lo que distingue a la inteligencia artificial de otras ramas de la informática. Ilustramos esto comparando el software de inteligencia artificial con el software tradicional. En primer lugar, desde la perspectiva más amplia, el software tradicional también debería pertenecer a la categoría de inteligencia artificial: de hecho, muchos de los primeros científicos informáticos, como Turing, comenzaron sus investigaciones en informática con la inteligencia artificial como fuerza impulsora. La llamada "informática" es originalmente una de las muchas actividades inteligentes del ser humano.

Una persona que nunca ha estado expuesta a computadoras puede tener dificultades para distinguir cuál está más calificada para representar "inteligencia" (la primera pertenece a la categoría de software tradicional y la segunda a la categoría de inteligencia artificial tradicional): "Encontrar todo números primos de una secuencia" y "Encontrar un perro a partir de una foto". Por otro lado, el software tradicional no representa toda la connotación de inteligencia artificial. En términos generales, podemos pensar que el software tradicional corresponde a tal "problema informático". Se parecen en que el problema en sí se describe mediante un algoritmo (o una descripción matemática no estructurada) y la investigación sobre ellos se centra principalmente en cómo encontrar mejores algoritmos. [7] Lo que llamamos “problemas de inteligencia artificial” puede entenderse como otro tipo de “problema de computación”. Su característica común es que no pueden definirse con precisión ni algorítmica ni matemáticamente. Las “respuestas correctas” a estas preguntas dependen esencialmente de cómo respondamos a ellas. Para problemas de inteligencia artificial, podemos diseñar algoritmos basados ​​en modelos matemáticos o modelos computacionales, pero la naturaleza del problema no es matemática.

La inteligencia artificial general se basa en el supuesto de una inteligencia artificial débil y tiene como objetivo simular de forma integral todos los comportamientos inteligentes humanos. Tenga en cuenta que la prueba de Turing, como condición suficiente, no se puede resolver hasta que se realice realmente la inteligencia artificial general. Por otro lado, se puede decir que el éxito de todas las ramas existentes de la IA es una condición necesaria para pasar la prueba de Turing, y la mayoría de ellas aún no han alcanzado el "nivel humano". Como no podemos agotar todos los comportamientos inteligentes humanos, debemos confiar en un número limitado de modelos y algoritmos universales para lograr la inteligencia universal. Actualmente, las personas sólo pueden diseñar algoritmos de aprendizaje, razonamiento y planificación basados ​​en algunos modelos simples y elementales. Por defecto, la investigación en estas ramas de la IA se basa en supuestos débiles de la inteligencia artificial sobre problemas en sus propios campos, y la fuerza impulsora que respalda la investigación en estos subcampos es a menudo su enorme valor práctico social. Aunque han logrado grandes logros en muchos campos de aplicación específicos, todavía parecen estar lejos de alcanzar el nivel requerido por la prueba de Turing.