Mapa del conocimiento

Debido a que participé en un proyecto relacionado con preguntas y respuestas inteligentes en el trabajo, necesitaba comprender el conocimiento del "gráfico de conocimiento". Como gerente de producto del lado B no técnico, acabo de poner un pie en el campo de la IA, que es un poco desconocido y desconocido.

Así que leí mucha literatura y ciencia técnica, y también consulté con estudiantes técnicos que están rodeados de IA. A partir de ellos, entendí aproximadamente algunos principios del "gráfico de conocimiento" y compilé los siguientes artículos.

Espero que mi artículo pueda ayudar a los gerentes de producto no técnicos o a estudiantes de otros puestos a comprender más fácil y rápidamente qué es un "gráfico de conocimiento".

Antes de presentar el mapa de conocimiento, hablemos sobre el uso del mapa de conocimiento en la vida diaria.

Por poner otro ejemplo, en la industria médica en línea, cuando los pacientes quieren registrarse pero no saben en qué departamento hacerlo, pueden obtener información del departamento a través del asistente de prediagnóstico. Basado en un mapa de conocimiento médico profesional, el asistente de prediagnóstico utiliza múltiples modelos de algoritmos y múltiples rondas de comunicación inteligente para comprender la condición del paciente y hacer coincidir con precisión el departamento médico de acuerdo con la condición del paciente.

Tomemos Alipay como ejemplo. En escenarios de pago, los gráficos de conocimiento se utilizan para eliminar de raíz el fraude de facturas, los retiros de efectivo con tarjetas de crédito y otros comportamientos. A través de la base de datos del gráfico de conocimiento, se realiza un análisis de correlación en diferentes individuos y grupos, y se puede juzgar a los usuarios por el comportamiento de los personajes dentro de un tiempo específico, como las direcciones IP de los lugares visitados, las direcciones MAC utilizadas (incluidos los teléfonos móviles). , PC, WIFI, etc.), análisis de correlación de redes sociales, si existe información histórica de transacciones entre cuentas bancarias.

Antes de describir la definición, primero echemos un vistazo al método de representación de Knowledge Graph 3354 [diagrama E-R]:

Como se puede ver en la figura anterior, no importa la forma y la apariencia en la que se transforma el diagrama E-R son todas redes relacionales conectadas por múltiples puntos y líneas.

Los llamamos puntos [entidades] y líneas [relaciones]. Cada entidad puede estar relacionada con una o más entidades. En base a esto, para formar la red de relaciones más simple, sólo se necesitan tres elementos: dos entidades y una relación. Esta estructura se llama "triple" y varios triples forman un gráfico de conocimiento.

(Tres veces)

Por ejemplo, "Xiao Fang y Xiao Ming son colegas y ambos necesitan comprar computadoras portátiles para trabajar. Xiao Ming sintió que usar una computadora portátil Apple sería mejor". ser más convincente, así que comenzó, y Xiaofang sintió que las computadoras portátiles Lenovo eran más baratas, por lo que eligió Lenovo. Más tarde, Xiaofang descubrió que los bocetos de software que su colega Amway había visto sólo estaban disponibles en Apple. Es más inteligente y fácil de usar que Axure. "A partir de esta frase, podemos desmontar varios tripletes:

Los tripletes del mapa de conocimiento no solo pueden expresar la relación entre entidades, sino también expresar algunos atributos de las entidades. Por ejemplo, "Xiao Ming" es una entidad, y su "género, fecha de nacimiento y lugar de origen" se pueden clasificar como atributos.

Las cosas se definen como los "atributos" de las entidades y existen dos principios básicos:

Al mismo tiempo, vale la pena señalar que, dependiendo de la situación real, las entidades a veces pueden ser atributos y los atributos también pueden ser entidades.

La siguiente figura es un ejemplo: "Empleado" es. una entidad, "Número de empleado, nombre, edad". es un atributo de un empleado si "título profesional" no está vinculado a "salario, asignaciones laborales, beneficios", en otras palabras, no tiene características que puedan describirse con más detalle. , entonces, de acuerdo con el estándar de 1, puede considerarse como un atributo de la entidad del empleado.

Sin embargo, si diferentes títulos profesionales tienen diferentes salarios, asignaciones laborales y diferentes beneficios adicionales, es más apropiado. Trate el título profesional como una entidad.

Dicho esto, debería poder comprender mejor la definición de mapa de conocimiento: el mapa de conocimiento es una base de conocimiento semántica estructurada que se utiliza para describir conceptos y sus relaciones en el. mundo físico en forma de símbolos. Su unidad básica son los triples "entidad-".Relación-entidad", así como las entidades y sus pares atributo-valor relacionados. Las entidades están conectadas entre sí a través de relaciones para formar una estructura de conocimiento de red.

Comprender la construcción de mapas de conocimiento puede ayudarnos a comprender mejor los principios del uso de mapas.

El proceso de construcción de un mapa de conocimiento se puede resumir de tres maneras:

Para presentar cada paso y su significado, compilé la siguiente tabla:

Indique la fuente para reimpresiones no comerciales.

La siguiente figura es el marco técnico del conocimiento. mapa, que puede ayudarlo a comprender mejor el proceso de construcción del mapa de conocimiento. Las partes en el cuadro de puntos son la construcción y la construcción del mapa de conocimiento.

1) Qué tipo. ¿Qué cantidad de datos se necesita para construir el mapa de conocimiento?

La respuesta es: datos estructurados.

En términos generales, existen tres tipos de datos sin procesar para los mapas de conocimiento: datos estructurados y datos no estructurados.

Los llamados datos estructurados se refieren a datos que están altamente organizados y bien formateados. Es un tipo de datos que se pueden colocar en una hoja de cálculo. Los datos estructurados típicos incluyen: números de tarjetas de crédito, fechas, montos financieros, números de teléfono, direcciones, nombres de productos, etc.

Por el contrario, los datos no estructurados se refieren a datos que no se organizan ni formatean fácilmente. No tiene un modelo de datos predefinido, por lo que no es conveniente utilizar la tabla lógica bidimensional de la base de datos para representar datos. Puede ser textual o no textual, creado por humanos o generado por una máquina.

En pocas palabras, los datos no estructurados son datos con campos variables, principalmente documentos, documentos, etc. Por ejemplo, algunos documentos contractuales, artículos, documentos PDF, etc.

Los datos semiestructurados no son relacionales y tienen un patrón de estructura fijo básico, como archivos de registro, documentos XML, documentos JSON, etc.

Para datos no estructurados y datos semiestructurados, debemos confirmar qué información se puede extraer de ellos y formular reglas de entrada de información. Con la ayuda de tecnologías como la PNL, se puede generar información efectiva en datos estructurados y luego los datos estructurados se pueden incorporar al gráfico de conocimiento.

2) La diferencia entre base de datos de gráficos y base de datos relacional

El mapa de conocimiento se basa en una base de datos de gráficos para almacenar datos. La llamada base de datos de gráficos no se refiere a una base de datos que almacena imágenes, sino a una base de datos que almacena la estructura de datos de los gráficos. El diagrama E-R del que hablamos antes es una representación visual de datos gráficos. Acerca de

A diferencia de las bases de datos relacionales tradicionales que utilizan tablas bidimensionales para almacenar datos, las bases de datos de gráficos se clasifican tradicionalmente como NoSQ.

La base de datos l (no solo SQL), es decir, la base de datos gráfica es una base de datos no relacional. Para evitar ser demasiado técnico, no introduciré datos gráficos en profundidad aquí. Hablaré brevemente sobre las diferencias entre las siguientes bases de datos y las bases de datos relacionales.

Las bases de datos relacionales no son buenas para procesar las relaciones entre datos, mientras que las bases de datos gráficas son flexibles y eficientes para procesar las relaciones entre datos.

Las bases de datos relacionales tradicionales tienen un rendimiento deficiente al procesar datos relacionales complejos, porque las bases de datos relacionales implementan referencias relacionales entre múltiples tablas a través de restricciones de clave externa. Consultar la relación entre entidades requiere operaciones JOIN, lo que suele llevar mucho tiempo.

La motivación del diseño original de las bases de datos de gráficos era describir mejor las relaciones entre entidades. La mayor diferencia entre las bases de datos gráficas y las bases de datos relacionales es la adyacencia sin índice. Cada nodo en el modelo de datos del gráfico mantiene sus relaciones de nodo vecino, lo que significa que el tiempo de consulta no tiene nada que ver con el tamaño general del gráfico, solo el número de vecinos de cada nodo, lo que hace que la base de datos del gráfico mantenga un buen rendimiento al procesar. un gran número de relaciones complejas para un buen rendimiento.

Además, la estructura del gráfico determina que sea fácil de ampliar. No tenemos que considerar todos los detalles al comienzo del diseño del modelo, porque es fácil agregar nuevos nodos, nuevas relaciones, nuevos atributos e incluso nuevas etiquetas más adelante sin romper las funciones de consulta y uso existentes.

En una base de datos relacional, si los campos de datos se diseñan al principio, será problemático agregar más campos después de ejecutarlos durante un período de tiempo. Los desarrolladores o gerentes de productos deben prever los campos que se pueden agregar en el futuro en la etapa inicial de desarrollo y agregarlos a la tabla de datos con anticipación.

Base de datos de gráficos secundarios

Un gráfico de conocimiento fácil de entender.

¿Qué es una base de datos gráfica?

La imagen del título proviene de Unsplash y está basada en el protocolo CC0.

Preguntas y respuestas relacionadas: ¿Qué significa PC? Terminal de PC es el término correspondiente a terminal móvil, que se refiere al puerto en el mundo de la red que se puede conectar al host de la computadora. Es un sistema de interfaz basado en computadora, que es diferente del sistema de interfaz de teléfono móvil de los terminales móviles. De hecho, el nombre completo en inglés de PC es: Personal Computer, que traducido al chino es: computadora personal o computadora personal. PC es una palabra con un significado amplio y también es el nombre colectivo de las computadoras. Actualmente, existen muchos tipos de computadoras personales, como las tradicionales computadoras de escritorio, computadoras de bricolaje, computadoras portátiles y tabletas, computadoras todo en uno, ultrabooks, computadoras de mano y computadoras integradas que se han vuelto populares en los últimos años. En otras palabras, PC es un término amplio que pertenece al término general de computadoras.