Definición de modelo para la Web Semántica

El modelo de datos del Marco de descripción de recursos (idioma extranjero: modelo de datos RDF) proporciona un modelo simple pero poderoso para describir un recurso específico a través de recursos, atributos y sus valores correspondientes. El modelo se define como: contiene una serie de nodos n; contiene una serie de clases de atributos p; cada atributo tiene un valor determinado V; el modelo es un triple: {nodo, clase de atributo, nodo o valor original v}; Cada "modelo de datos" (idioma extranjero: modelo de datos) puede considerarse como un gráfico dirigido compuesto de nodos y arcos. Todos los recursos descritos en el modelo y los valores de atributos utilizados para describir los recursos pueden considerarse "nodos". El triplete que consta de nodo de recurso, clase de atributo y valor de atributo se denomina declaración RDF (o declaración RDF). En un modelo, las declaraciones pueden aparecer como nodos de recursos y nodos de valor, por lo que a veces hay varios nodos en un modelo. En este momento, el nodo de valor utilizado para describir el nodo de recurso en sí también tiene clases de atributos y valores, que pueden refinarse aún más.

RDF Schema utiliza un sistema comprensible por máquina para definir palabras que describen recursos. Funciona como un diccionario y puede entenderse como un esquema o una especificación. La función del esquema RDF es definir categorías de recursos y atributos; definir clases de recursos y tipos de valores de atributos para los atributos de la aplicación; definir la sintaxis de las declaraciones de categorías anteriores; declarar algunas clases de atributos de estándares de metadatos definidos por otras instituciones u organizaciones. El esquema RDF define

tres clases principales: rdf: recurso, rdfs: propiedad, rdfs: clase;;

cinco atributos principales: rdf: tipo, rdfs: subClassOf, rdfs: consulte también , rdfs: subPropertyOf, rdfs: isDefinedBy;;

Cuatro restricciones principales: rdfs: ConstrantResource, rdfs: range, rdfs: ConstraintProperty y rdfs: domain.

La sintaxis RDF construye un sistema de sintaxis completo para facilitar el procesamiento informático automático. Utiliza XML como lenguaje anfitrión y realiza la integración de varios metadatos a través de la sintaxis XML.

La ontología fue originalmente un concepto filosófico utilizado para estudiar la naturaleza del mundo objetivo. En la actualidad, la ontología se ha utilizado ampliamente en muchos campos, incluida la informática, la ingeniería electrónica, la educación a distancia, el comercio electrónico, la recuperación inteligente, la minería de datos, etc. Es un documento o documento que define formalmente la relación entre sustantivos. Las ontologías en la web general incluyen clasificación y un conjunto de reglas de inferencia. La clasificación se utiliza para definir las categorías de objetos y sus relaciones; las reglas de inferencia proporcionan funciones adicionales y completan el objetivo clave de la Web Semántica, es decir, la "comprensibilidad de las máquinas". El objetivo final de la ontología es "representar con precisión esa información implícita (o vaga)".

Actualmente no existe una definición unificada de ontología. Por ejemplo, la ontología es una especificación formal de un modelo conceptual * * * *, que describe la semántica de los conceptos a través de la relación entre conceptos; la ontología es una representación y descripción clara de los objetos conceptuales; dominio, etc Pero la definición dada por Gruber de la Universidad de Stanford ha sido reconocida por muchos colegas, es decir, "la ontología es una especificación de visualización conceptual". La conceptualización (lengua extranjera: conceptualización) se define como: C =, donde C representa el objeto de la conceptualización, d representa un dominio, w es el conjunto de cosas relacionadas en el dominio y Rc es el conjunto de relaciones conceptuales en el espacio del dominio. . La especificación (idioma extranjero: especificación) es formar una comprensión y comprensión unificadas de los conceptos, el conocimiento y las relaciones entre conceptos en el campo, para facilitar * * * el disfrute y la reutilización.

La ontología requiere cierto lenguaje para describir la conceptualización. Según el grado de formalización de la representación y descripción, la ontología se puede dividir en ontología completamente informal, ontología semiinformal, ontología semiformal y ontología formal estricta.

Hay muchos lenguajes que se pueden usar para expresar ontologías, algunos de los cuales se basan en la sintaxis XML y se usan en la Web Semántica, como XOL (lenguaje de intercambio de ontologías basado en XML), Shoe (lenguaje de ontología HTML simple), OML. (Ontology Markup Language) y RDF y RDF Schema (RDFS) creados por el W3C. También existen lenguajes de ontología relativamente completos DAML (DARPA Agent Markup Language), OIL y DAML OIL basados ​​en RDF y RDFS.

XOL es un lenguaje de intercambio de ontologías basado en la sintaxis XML y la semántica OKBC. Fue diseñado por el Grupo de Bioinformática de EE. UU. para intercambiar definiciones de ontología entre un conjunto de sistemas de software heterogéneos en el campo. Está basado en Ontolingua y OML, integrando las expresiones avanzadas de OKBC y la sintaxis de OML. Actualmente, no existen herramientas que admitan el desarrollo de ontologías XOL, pero debido a que utiliza sintaxis XML, puede utilizar un editor XML para crear archivos XOL. SHOE, desarrollado en la Universidad de Maryland, combina conocimiento semántico legible por máquina con documentos HTML u otros documentos web, permitiendo el diseño y la aplicación directa de ontologías basadas en la WWW. Recientemente, la sintaxis de SHOE se trasladó a XML, lo que permite a los agentes recopilar información significativa sobre páginas web y documentos y mejorar los mecanismos de búsqueda y la recopilación de conocimientos. OML fue desarrollado en la Universidad de Washington y se basa en parte en zapatos. Tiene cuatro niveles: capa central OML (relacionada con la capa lógica del lenguaje); OML simple (mapeo directo de RDF y RDFS), OML simplificado y OML estándar.

RDF es un método de descripción de información recomendado por el W3C. Su objetivo es superar las limitaciones semánticas de XML y proporcionar un esquema simple para representar varios tipos de recursos. Sobre la base de RDF, RDFS establece algunas restricciones básicas del modelo. RDF tiene fuertes capacidades expresivas, pero todavía tiene algunas deficiencias. Por ejemplo, RDF no define un mecanismo de razonamiento y axiomas, no explica las características de inclusión y no tiene control de versiones.

OIL se basa en RDF y su principal ventaja es proporcionar un razonamiento semántico formal basado en la lógica de descripción. OIL integra tres tecnologías: sistema marco, lógica de descripción y lenguaje web basado en sintaxis XML y RDF. El sistema marco utiliza un enfoque orientado a objetos para modelar datos y proporciona primitivas de modelado. La lógica de descripción expresa conocimientos estructurados, consultas y razonamientos de forma estandarizada; el lenguaje web basado en la sintaxis XML y RDF proporciona elementos lingüísticos para el petróleo. Los objetos de datos de OIL incluyen principalmente: definición de clase, definición de ranura y definición de axioma. Las definiciones de clases incluyen tipos de definición, jerarquías de clases y restricciones de ranuras o restricciones de atributos que definen relaciones binarias entre entidades, incluidas definiciones de ranuras primitivas, dominios, rangos, inversas, subranuras, etc. Las definiciones axiomáticas definen algunas reglas adicionales en la ontología, como desunión, cobertura, intersección, equivalencia, etc.

DAML fue desarrollado por DARPA (Agencia de Investigación de Proyectos Avanzados del Departamento de Defensa de EE. UU.) e intenta combinar las ventajas de RDF y OIL. Al igual que Petroleum, DAML se basa en RDF y descripción lógica. Su principal objetivo es desarrollar un lenguaje diseñado para expresar relaciones semánticas de forma legible por máquina y que sea compatible con las tecnologías actuales y futuras. En particular, desarrollar un conjunto de herramientas y técnicas que permitan a los programas Agent identificar y comprender fuentes de información. implementar programas de agentes entre ellos. La primera versión de DAML fue DAML-ONT, pero se combinó estrechamente con petróleo para formar aceite DAML. El petróleo DAML es desarrollado conjuntamente por Estados Unidos y la Unión Europea en el contexto de DAML. Tiene el mismo objetivo que OIL y actualmente es el lenguaje de ontología más utilizado. Es una extensión de RDF (S) y tiene suficientes capacidades de expresión (como unicidad, transitividad, inversión, equivalencia, etc.) y ciertas capacidades de razonamiento, lo que determina completamente el marco general del lenguaje de representación del conocimiento en la Web Semántica.

Por supuesto, XML y RDF no son las únicas formas de implementar la Web Semántica. El problema técnico más importante es que las computadoras "piensan" y "razonan" demasiado. Sin embargo, cuando se enfrentan a problemas complejos, especialmente problemas sociales, todavía es difícil para las personas tomar decisiones, y mucho menos para las computadoras.

Por lo tanto, todavía queda mucho trabajo por hacer para realizar realmente una Web Semántica práctica.