1. Recuperación lógica booleana
El uso de operadores lógicos booleanos para combinar lógicamente términos o códigos de búsqueda es la recuperación de información moderna. Tecnologías comúnmente utilizadas en el sistema. Hay tres operadores lógicos booleanos de uso común: O lógico, Y lógico y NO lógico.
2. Recuperación de interceptación
La recuperación de interceptación es una tecnología muy común en los sistemas de recuperación informáticos. Debido a las características de formación de palabras de las lenguas occidentales, las formas singular y plural de los sustantivos a menudo son inconsistentes en las búsquedas; la ortografía británica y estadounidense de palabras con el mismo significado puede derivar al agregar prefijos y sufijos de diferentes naturalezas a las raíces; muchas palabras con significados similares, etc. Ésta es la necesidad de utilizar la búsqueda por segmentación de palabras.
3. Recuperación de ubicación
La recuperación de ubicación también se denomina recuperación de texto completo y recuperación de proximidad. La llamada búsqueda de texto completo consiste en utilizar el lenguaje natural en el registro para buscar. La relación lógica entre palabras se combina con operadores de posición para limitar las posiciones relativas entre los términos de búsqueda. Este es un método técnico que no depende de diccionarios de sinónimos y puede utilizar directamente palabras libres para buscar.
4. Recuperación de campos limitada
La recuperación por restricción de campos se refiere a un método de recuperación que limita los términos de búsqueda a uno o varios campos en el registro de la base de datos. En el sistema de recuperación, generalmente hay dos tipos de campos en la base de datos para la recuperación: campos básicos que expresan las características del contenido temático del documento y campos auxiliares que expresan las características externas del documento.
5. Búsqueda ponderada
La búsqueda ponderada es una tecnología de búsqueda cuantitativa proporcionada por algunos sistemas de búsqueda. La recuperación ponderada, al igual que la recuperación booleana y la recuperación por truncamiento, también es un método de recuperación básico para la recuperación de literatura. Sin embargo, a diferencia de ellos, el objetivo de la recuperación ponderada no es determinar si el término o cadena de búsqueda existe en la base de datos. términos de búsqueda o cadenas ¿Cuál es la relación, pero para determinar el impacto de las palabras o cadenas de búsqueda en si el documento se accede después de que se satisface la lógica de búsqueda?
6. Recuperación de agrupaciones
La agrupación consiste en clasificar cosas no clasificadas en la misma categoría sin saber en cuántas categorías deben clasificarse, en función de los diferentes atributos internos de las cosas. clasificar información con atributos similares en la misma categoría.
Pregunta 2: ¿Qué es la tecnología de recuperación informática? Búsqueda booleana, búsqueda por posición de palabra, búsqueda por corte, búsqueda por campo, búsqueda ponderada y tipo de búsqueda.
Pregunta 3: ¿Cuáles son las tecnologías de recuperación informática? En los sistemas informáticos de recuperación de información, existen seis técnicas de recuperación comúnmente utilizadas:
1. Recuperación de lógica booleana
2. Recuperación de interceptación
3. Recuperación de campo limitada
5. Recuperación ponderada
6. Recuperación en clúster
Pregunta 4: Describa brevemente los tipos de técnicas básicas de recuperación informática. Los tipos básicos de técnicas de recuperación por computadora incluyen la recuperación de lógica booleana, la recuperación de truncamiento, la recuperación de calificadores y la recuperación de operadores posicionales.
1. La búsqueda lógica booleana también se denomina búsqueda lógica booleana. En sentido estricto, el método de búsqueda booleano se refiere a un método que utiliza operadores lógicos booleanos para conectar varios términos de búsqueda y luego la computadora realiza las operaciones lógicas correspondientes para encontrar la información requerida. Ampliamente utilizado y de uso frecuente. La función de los operadores lógicos booleanos es conectar términos de búsqueda para formar una fórmula de búsqueda lógica.
2. La recuperación de interceptaciones es una tecnología de recuperación común para evitar detecciones perdidas y mejorar la tasa de recuperación. La mayoría de los sistemas ofrecen capacidades de recuperación de interceptaciones. La interceptación se refiere a truncar la palabra de búsqueda en la posición adecuada y luego procesarla con un segmentador de palabras. Esto no solo puede guardar la cantidad de caracteres ingresados, sino también lograr una alta tasa de recuperación.
3. La búsqueda por rango es un método para optimizar los resultados de la búsqueda limitando el alcance de la búsqueda. Hay muchas formas de limitar su búsqueda, como búsquedas de campos, uso de calificadores, uso de comandos de búsqueda restringidos, etc.
4. La recuperación del operador posicional también se denomina recuperación de proximidad. El orden relativo o la posición de las palabras en el registro del documento es diferente y el significado expresado puede ser diferente. Sin embargo, el orden relativo de las palabras en la misma expresión de búsqueda es el mismo y la intención de búsqueda es diferente.
La recuperación de operadores posicionales utiliza algunos operadores específicos (operadores posicionales) para representar la relación de proximidad entre los términos de búsqueda y puede usar directamente palabras libres sin depender del léxico.
Pregunta 5: ¿Qué es la recuperación de información informática? La recuperación de información informática es una tecnología de aplicación informática desarrollada aprovechando las capacidades de almacenamiento eficaz y recuperación rápida de los sistemas informáticos. Implica la estructura, análisis, organización, almacenamiento y difusión de información. Un sistema informático de recuperación de información es una combinación de recursos de hardware, software del sistema y software de recuperación utilizados para la recuperación de información. Puede almacenar grandes cantidades de información y clasificar, catalogar o indexar elementos de información (unidades de información básicas con significados lógicos específicos). Puede extraer información específica de la información almacenada según los requisitos del usuario y brindar la capacidad de insertar, modificar y eliminar cierta información.
Pregunta 6: ¿Cuáles son las ventajas de la recuperación informática? A partir de los conceptos de recuperación manual y recuperación por computadora, este artículo analiza las ventajas y desventajas respectivas de la recuperación manual y la recuperación por computadora, así como su relación mutua, y cree que la recuperación manual y la recuperación por computadora existirán durante mucho tiempo.
Resumen: A partir de los conceptos de recuperación manual y recuperación por computadora, este artículo analiza las ventajas y desventajas respectivas de la recuperación manual y la recuperación por computadora, así como su relación mutua, y cree que la recuperación manual y la recuperación por computadora existen desde hace mucho tiempo.
Palabras clave: recuperación manual; recuperación por computadora; información bibliográfica
Número de clasificación de la Biblioteca de China: G252.7 Código de identificación del documento: a.
1 El concepto de recuperación manual y recuperación por computadora
La recuperación manual, denominada inspección manual, es un método tradicional utilizado por las personas en la práctica a largo plazo de recuperación de información documental. Es un término general para varios métodos que las personas utilizan para juzgar directamente a través del cerebro y utilizar herramientas mecánicas simples para recuperar materiales grabados en soportes comunes. Es el proceso en el que los buscadores buscan pistas literarias a través de herramientas de búsqueda como catálogos de libros, catálogos de tarjetas y, más tarde, catálogos de tarjetas perforadas. La recuperación manual se completa mediante operaciones manuales humanas, y su combinación es el pensamiento, la comparación y la selección del cerebro humano. Los métodos más comunes y básicos son el método retrospectivo, el método instrumental y el método alterno mixto.
La recuperación por computadora (denominada recuperación por computadora) se refiere al método de utilizar computadoras para buscar la información requerida del documento a través de varias bases de datos. El proceso de recuperación lo completan humanos que operan computadoras, y la comparación la realizan computadoras. En el proceso de recuperación, las personas son las que diseñan y operan todo el plan de recuperación. La recuperación informática se basa en el rápido desarrollo de la tecnología informática, la tecnología de la comunicación y la tecnología de redes, y tiene una importancia histórica en el campo de los servicios de información. Fue producido en la década de 1950 y desarrollado a mediados de la década de 1980. Después de la década de 1990, con el desarrollo de la tecnología de Internet, entró en un nuevo período.
2 Ventajas de la recuperación manual
(1) La recuperación manual puede comprender las reglas de indexación y registrar entradas de acuerdo con las reglas, lo que facilita a los buscadores verificar los documentos relevantes según el documento. reglas de indexación.
(2) La búsqueda manual puede comprender el alcance, la cobertura profesional, las características y los puntos de edición de varias revistas recuperadas. El período de búsqueda retrospectiva es largo, lo que puede mejorar la tasa de recuperación y la tasa de precisión.
(3) La recuperación manual tiene alta flexibilidad y bajo costo.
(4) La recuperación manual también facilita la formulación y modificación de estrategias de búsqueda. La información bibliográfica obtenida generalmente puede satisfacer las necesidades de información del buscador, y los problemas descubiertos durante el proceso de recuperación manual se pueden modificar y plantear. de manera oportuna. En el proceso de recuperación manual, son las personas las que buscan directamente las tareas, y el pensamiento humano siempre ha jugado un papel destacado en el proceso de búsqueda. Durante el proceso de búsqueda, los buscadores pueden aclarar continuamente sus necesidades de información y modificar continuamente sus preguntas de búsqueda en función de los resultados de la búsqueda. La combinación de signos de interrogación de búsqueda y signos característicos de documentos en el sistema de recuperación puede ser completamente consistente en contenido, concepto y forma, y no requiere una combinación literal estricta. Por lo tanto, la información bibliográfica recuperada generalmente puede satisfacer las necesidades de información del buscador.
(5) En términos de visualización del contenido del soporte, la recuperación manual también es mejor que la recuperación por computadora. Con la ayuda de herramientas de recuperación manual, las personas pueden interpretar la descripción de un documento específico de un vistazo sin utilizar ningún equipo de conversión y también pueden comprender todos los documentos con mayor precisión. Este no es el caso de la recuperación por ordenador, que sólo puede interpretarse con la ayuda de las herramientas de lectura correspondientes, como ordenadores, lectores de CD, etc.
3 Desventajas de la recuperación manual
3.1 La velocidad de recuperación es lenta.
Los investigadores suelen tardar varios días o incluso meses en buscar un tema determinado, lo que consume mucho tiempo y energía por parte de los lectores. Si utiliza una computadora para buscar, generalmente solo le llevará unas pocas horas o incluso minutos completarla.
3.2 La recuperación está limitada por el tiempo y el espacio.
En primer lugar, debido a la limitación del horario de apertura de la biblioteca, el horario general de la biblioteca es fijo, 8 horas diarias, cerrada los sábados y domingos. Esto deja poco tiempo para que los lectores utilicen la biblioteca. Si los lectores quieren consultar información sobre un tema determinado, sólo pueden hacerlo durante el horario de atención. Fuera del horario de apertura, los lectores no encontrarán ninguna información. En segundo lugar, debido a limitaciones de espacio, es imposible para los investigadores científicos visitar todas las bibliotecas del país o incluso del mundo cuando buscan un tema determinado.
3.3 La búsqueda está limitada por los recursos de la colección.
Ninguna biblioteca puede recopilar todos los materiales sobre todos los temas de la historia de la humanidad. Para buscar un tema determinado o desarrollar un proyecto determinado, los investigadores tienen que viajar de un lado a otro entre varias bibliotecas mediante búsqueda manual. Aun así, a los investigadores les resulta imposible verificar toda la información.
3.4 Ciclo largo de actualización
Libros y publicaciones periódicas desde la impresión hasta los gráficos> gt
Pregunta 7: ¿Qué es la tecnología de recuperación de información? ¿Cuáles son las categorías principales? ¿Cuáles son las características de búsqueda de cada uno? Tecnología de recuperación de información La recuperación de información se refiere al método y proceso de encontrar la información que un usuario específico necesita en un momento específico y bajo condiciones específicas a partir de información compuesta de cualquier manera. Incluye principalmente búsqueda booleana, búsqueda por posición de palabras, búsqueda por corte y búsqueda restringida. Las características de la búsqueda booleana son (1) en línea con los hábitos de pensamiento de las personas; (2) expresión intuitiva y clara, estructura sólida; (3) fácil de expandir y limitar la búsqueda (4) fácil de implementar en la computadora.
Pregunta 8: ¿Cuáles son los métodos comunes de recuperación informática? 20 puntos para aclarar los requisitos de búsqueda y los objetivos de búsqueda.
El primer paso en la recuperación informática es aclarar los requisitos y objetivos de la búsqueda.
Definir los requisitos de búsqueda es determinar a qué disciplina pertenece el tema, el tipo e idioma de los documentos requeridos, la antigüedad de los documentos a buscar, el número óptimo de documentos requeridos y el costo de búsqueda permitido. Estos requisitos son importantes a la hora de seleccionar una base de datos y construir una estrategia de búsqueda.
Determinar el objetivo de recuperación también es una preparación clara que se debe realizar antes de la recuperación de información por computadora. Por ejemplo, si se trata de una encuesta abierta, es necesario recuperar la mayor cantidad de documentos relevantes posible, lo que requiere una alta tasa de recuperación para poder preparar completamente las preguntas; si se trata de un tema exploratorio y pionero; Solo es necesario encontrar algunos documentos esclarecedores, no. Deben existir altos requisitos de precisión y recuperación.
Análisis del proyecto
1. El método para analizar el concepto de la pregunta es analizar los conceptos principales involucrados en la pregunta, encontrar algunas palabras o frases que puedan representar estos conceptos y Luego analice la relación entre los conceptos. La relación entre arriba, abajo, izquierda y derecha. Para las disciplinas emergentes, las disciplinas interdisciplinarias y las disciplinas límite, es necesario comprender la relación entre estos conceptos. Los resultados del análisis de conceptos deben enumerarse en forma de palabras o frases en grupos de conceptos para su uso en la siguiente estrategia de búsqueda.
2. Método de análisis de conceptos implícitos El contenido sustantivo de algunas preguntas suele ser difícil de reflejar a partir de las preguntas. Es necesario realizar un análisis en profundidad de los conceptos y contenidos relacionados implícitos en el tema desde la perspectiva de la especialidad a la que pertenece el tema, con el fin de extraer conceptos de recuperación que puedan reflejar con precisión el contenido del tema. Por ejemplo, la seguridad social incluye los conceptos de seguro de pensiones, seguro de desempleo, seguro médico y asistencia social. Si desea buscar literatura sobre seguridad social, debe aislar los conceptos anteriores para garantizar la tasa de recuperación de la literatura.
3. Selección de conceptos centrales Algunos conceptos que ya están incluidos en algunos términos de búsqueda deben excluirse del análisis de conceptos. Por ejemplo, cuando se combinan los seis conceptos de compensación laboral, capacitación de los empleados, seguro de pensiones, empresa, sistema y administración, se perderá una gran cantidad de documentos. De hecho, la gestión de los recursos laborales ya incluye tres aspectos: la compensación laboral, la formación de los empleados y el seguro de pensiones deben centrarse en estos tres aspectos. Por tanto, esta pregunta sólo necesita utilizar los dos conceptos esenciales de recursos laborales y gestión.
Para mejorar la precisión del documento, los términos de búsqueda requeridos deben seleccionarse del vocabulario estándar correspondiente. Y al determinar los términos de búsqueda, no solo debe considerar sinónimos, sinónimos y otros términos de búsqueda relacionados que reflejen el concepto del tema, sino también prestar atención a las abreviaturas y palabras con diferente ortografía de los términos de búsqueda seleccionados para evitar perder documentos relevantes.
4.3.3 Ampliación, selección y procesamiento de términos de búsqueda
El actual sistema informático de recuperación de información no tiene la capacidad de pensar de forma inteligente y no recuperará de forma automática y completa los términos de búsqueda introducidos. . y todas las palabras involucradas. Por lo tanto, es necesario enumerar palabras relacionadas con el concepto basándose en el análisis de conceptos, realizar selecciones a partir de ellas y utilizar métodos como el truncamiento de palabras para fusionar términos de búsqueda.
1. Los métodos para ampliar los términos de búsqueda para un mismo concepto generalmente incluyen sinónimos, tesauros y truncamiento de palabras.
(1) Método sinónimo. Dentro de un mismo ámbito conceptual, desde una perspectiva lingüística, se eligen diferentes nombres, diferentes métodos ortográficos y formas singulares y plurales. Los diferentes nombres incluyen nombres científicos y comunes, abreviaturas y nombres completos, nombres comerciales y nombres de sustancias o productos, nombres en clave de cosas y nombres científicos de cosas. Diferentes métodos de ortografía, tomando como ejemplo el inglés, incluidas las diferencias entre el inglés británico y el inglés americano.
(2) Método de corte de palabras. Cuando algunos términos de búsqueda tienen la misma raíz y significados similares, pero el final de la palabra o la palabra del medio ha cambiado (cambios en singular y plural en la mayoría de las palabras en inglés y diferentes formas de ortografía en el Reino Unido y los Estados Unidos), el truncamiento de la palabra El método se puede utilizar para ampliar los términos de búsqueda. Este método requiere un guión después de la raíz. ¿La separación de sílabas generalmente incluye? ampq... gt gt
Pregunta 9: ¿Cuáles son las "tecnologías de frontera" de las tecnologías informáticas de vanguardia? Se refieren a "tecnologías importantes que son progresistas, pioneras y exploratorias en el campo de la alta tecnología. Son una base importante para futuras actualizaciones de alta tecnología y el desarrollo de industrias emergentes, y son un reflejo integral de la alta tecnología del país". -capacidades de innovación tecnológica.
Existen principalmente los siguientes seis puntos:
(1) SIG y Tierra Digital (2) Realidad Virtual (3) Tecnología de recuperación de información WEB inteligente y personalizada ( 4) Tecnología inteligente de procesamiento de información (5) Tecnología Network Grid y computación en la nube (6) Red de próxima generación
Pregunta 10: Según el método de adquisición de información, ¿en qué se pueden dividir los sistemas informáticos de recuperación de información? Según el método de adquisición de información, se puede dividir en sistema de recuperación en línea y sistema de recuperación de información en CD-ROM y sistema de recuperación de información en red.