Discusión sobre la tecnología del espectro del conocimiento y su mejora de aplicaciones.

Prólogo y antecedentes: en el proceso de construcción de un gráfico de conocimiento, una gran cantidad de información de conocimiento proviene de documentos y páginas web. El proceso de extracción de conocimiento de los documentos a menudo causa desviaciones. Estas desviaciones provienen de dos aspectos:(1) Habrá mucha información ruidosa en el documento, es decir, información inútil. Esta información puede provenir del propio algoritmo de extracción de conocimiento o puede estar relacionada con la efectividad del lenguaje en sí;

(2) La cantidad de información en el documento es limitada y no cubrirá todos los conocimientos, especialmente muchos conocimientos de sentido común.

Lo anterior conducirá a mapas de conocimiento incompletos, por lo que la integridad de los mapas de conocimiento se está volviendo cada vez más importante en la construcción de mapas de conocimiento.

A través del conocimiento adquirido se predice la relación entre entidades para completar la relación entre entidades o la información de tipos de entidades. Este proceso se puede lograr utilizando el conocimiento interno de esta base de conocimiento o introduciendo el conocimiento de una base de conocimiento de terceros.

Compiló un paquete de datos de IA de 200G:

①Los cursos y proyectos de inteligencia artificial contienen código fuente de material didáctico.

②Una explicación súper detallada de la hoja de ruta de aprendizaje de la inteligencia artificial.

③La inteligencia artificial debe leer resúmenes de libros y libros electrónicos de alta calidad.

④ Recursos de élite reconocidos en el país y en el extranjero

(5) Organice sitios web de recursos de inteligencia artificial de alta calidad (busque personas mayores, busque códigos, busque artículos)

⑥Informe de la industria de la inteligencia artificial

⑦Procedimientos de inteligencia artificial

/P3 .toutiaoimg com/origin/tos-cn-I-qvj 2 LQ 49k 0/36 AE 8d 96 bcff 490. bb 4d 877 abda 852 f 7d "," uri ":", "width": 31, "height": 27, "darkImgUrl": "-I-qvj 2 LQ 49k 0/b 81 AEA 2925484 cf 5 bde 9 cbb4 C2 c 62 FD "," darkImgUri

¡Los datos están organizados de manera muy ordenada en el disco de red! Espero que sea útil para el estudio de todos.

Hay puntos de finalización del gráfico de conocimiento. dos niveles de finalización de conocimiento a nivel de concepto y finalización de conocimiento a nivel de instancia.

A menudo se menciona que en el proceso de construcción del gráfico de conocimiento solo se menciona la extracción de entidades y relaciones, y luego las entidades y relaciones pueden.

Sin embargo, no es suficiente obtener tripletas, estas deben considerarse, porque las entidades en tripletas también se pueden asignar a conceptos de conocimiento además de sus atributos y relaciones. tipos relacionados, una entidad puede tener múltiples tipos

Por ejemplo, el tipo de entidad de Obama difiere en diferentes relaciones

En la descripción de la información de nacimiento, el tipo es Humano en la descripción de escribir un; memorias, también puedes ser escritor; en la descripción del trabajo, también puedes ser político

Modelo de jerarquía conceptual de tipos de entidades

Aquí: Persona Hay capas entre los conceptos. de escritores y políticos. Este es un modelo jerárquico de conceptos.

1. Completar el conocimiento a nivel conceptual: resuelve principalmente el problema de la falta de información del tipo de entidad. En el ejemplo anterior, una vez que una entidad es reconocida como de tipo humano, aún necesita buscar conceptos inferiores además del tipo humano para encontrar más información de descripción de categoría.

(1) Mecanismo de razonamiento de reglas basado. sobre lógica de descripción.

Ontología y patrón: Ambas entidades pueden atribuirse a una ontología, y esta ontología tiene un conjunto de patrones para garantizar su unicidad y puede describirse mediante reglas. Se pueden usar reglas para describirlo.

Por ejemplo, Obama es una entidad, y su ontología se puede atribuir a las personas, y el modelo humano puede usar el lenguaje y las herramientas para transformar otras cosas, etc., etc. Estos patrones pueden describirse mediante reglas, por lo que surgió el método de razonamiento de reglas basado en la lógica de descripción.

La lógica de descripción es una representación de conocimiento común basada en conceptos y relaciones.

Por ejemplo, puede recopilar instancias de entidades (que pueden ser texto) sobre personas, extraer patrones de ellas y registrarlas en forma de reglas. De esta manera, cada vez que encuentre una nueva instancia de entidad, solo necesita sustituir las reglas registradas previamente para compararlas y emitir un juicio. Si cumple con las reglas, significa que la instancia puede clasificarse como un tipo de concepto humano; de lo contrario, se juzgará como un tipo sin concepto.

(2) Mecanismo de inferencia de tipos basado en aprendizaje automático.

Después de experimentar la etapa de desarrollo del razonamiento de reglas basado en la lógica de descripción, la investigación relacionada con el aprendizaje automático comenzó a ocupar la corriente principal. En este momento, no solo es necesario utilizar pistas internas, como reglas generadas por instancias, para emitir juicios, sino también utilizar características y pistas externas para aprender predicciones de tipos.

Para un tipo desconocido de entidad e1, si se puede encontrar un tipo de entidad e2 similar y conocido, se puede inferir que el tipo de entidad e1 debe ser igual o al menos similar al tipo de e2.

Este tipo de método se puede dividir en tres direcciones: inferencia de tipos basada en contenido, inferencia de tipos basada en enlaces e inferencia de tipos basada en relaciones estadísticas (como la red lógica de Markov).

(3) Mecanismo de razonamiento basado en el aprendizaje por representación.

El aprendizaje integrado y el aprendizaje profundo se introducen en el razonamiento tipográfico. La mayoría de los métodos de inferencia de tipos basados ​​​​en el aprendizaje automático suponen que no hay ruido en los datos y que sus características aún deben considerarse como una elección y un diseño. La introducción del aprendizaje profundo puede evitar la ingeniería de funciones. La inferencia de tipos debe basarse en el contenido del texto y también debe estar respaldada por otras características, como la estructura de enlaces. Aquí es donde el enfoque integrado puede sacar provecho de sí mismo.

2. Completar conocimiento a nivel de instancia

Se puede entender como: para un ejemplo triplete (SPO, sujeto-predicado-objeto), las posibles omisiones son (?, P, O), (S,?,o) o (s,p,), es como si el triplete no existiera en la base de conocimiento, por lo que es necesario predecir cuál es la entidad o relación que falta.

De hecho, se pueden inferir muchos conocimientos faltantes a partir del conocimiento adquirido. A veces, este proceso también se denomina predicción de enlaces.

Nota: A veces el conocimiento no falta, sino nuevo, es decir, aparece un nuevo triplete, y este triplete no se conoce en la base de conocimiento original. En este momento, es necesario agregarlo a la base de conocimientos como conocimiento nuevo, pero esta situación no se completa en el sentido tradicional.

(1) Método de finalización probabilístico basado en paseo aleatorio

(2) Método complementario basado en aprendizaje de representación

Proceso de incrustación de mapas de conocimiento:

①Representación de incrustación estructural

②Método de red neuronal tensorial

③Método de descomposición matricial

④Método de traducción

(3) Otros métodos de finalización

Método de finalización de la base de conocimientos cruzados, método de finalización de la base de conocimientos basado en tecnología de recuperación de información y finalización de conocimientos de sentido común en la base de conocimientos.

Desafíos y principales direcciones de desarrollo:

(1) Resolver la escasez de entidades y relaciones de cola larga.

Hay muchos ejemplos de relaciones entre celebridades y estrellas, mientras que hay pocos ejemplos de personas comunes y corrientes, pero hay innumerables ejemplos. Esto da como resultado ejemplos muy escasos de sus relaciones relacionadas, y esta situación aumentará a medida. El número aumenta. Más obvio.

(2) Problemas de entidades uno a muchos, muchos a uno y muchos a muchos.

Para datos a gran escala, no es tan simple como un par de docenas o docenas de órdenes de magnitud, sino cientos de órdenes de magnitud. Las soluciones tradicionales no pueden ser efectivas y Shenzhen simplemente no puede resolver el problema del aprendizaje relacional de esta magnitud.

(3) El aumento y cambio dinámico del triplete conduce a la intensificación de los cambios dinámicos de KG.

Constantemente se generan nuevos conocimientos y los conocimientos previos pueden posteriormente resultar erróneos o necesitar ser corregidos. Esto hará que sea necesario revisar y cambiar el proceso de finalización del conocimiento. Cómo adaptar la tecnología de finalización de gráficos de conocimiento a los cambios dinámicos de KG se ha vuelto cada vez más importante, pero esta tecnología no ha atraído suficiente atención.

(4) La longitud del camino previsto de la relación en 4)KG seguirá aumentando.

La duración del razonamiento de predicción de relaciones es limitada, pero cuando surgen gráficos de conocimiento a gran escala, la secuencia de rutas de relación entre entidades se volverá cada vez más larga, lo que requiere modelos más eficientes para describir modelos de predicción de relaciones más complejos. .