1.1 Buscador único (buscador independiente) Se caracteriza por recuperar información únicamente en la base de datos del propio buscador, como por ejemplo Yahoo.
1.2 Metabuscador (Metabuscador) completa la función de recuperación llamando a otros motores de búsqueda independientes al recuperar información y puede procesar los resultados consultados desde múltiples motores de búsqueda independientes en diversos grados, como Eliminar resultados duplicados , comprobar conexiones, ordenar resultados por relevancia y más. El propio metabuscador puede tener o no su propia base de datos. Dado que los motores de búsqueda independientes vinculados a diferentes metabuscadores son diferentes, la sintaxis de consulta de los motores de búsqueda independientes es bastante diferente. El metabuscador en sí solo admite operaciones de sintaxis simples como AND, 0R y N0T, y los resultados devueltos. Solo puede satisfacer el "mínimo común denominador", es decir, la precisión de los resultados de la búsqueda no se puede mejorar.
1.3 Motor de búsqueda de red (software de búsqueda de red) significa que los usuarios de la red pueden descargar el software de búsqueda correspondiente en sus computadoras locales e instalar la consulta. Este es un navegador fuera de línea con capacidades de consulta de red. En comparación con los metabuscadores, los resultados de salida se pueden controlar de manera flexible. Su característica más importante es que es fácil de usar y puede consultar rápidamente recursos de red relacionados. 2 El principio de funcionamiento y la composición básica de los motores de búsqueda de red
Cuando un usuario recupera información, el motor de búsqueda busca la información correspondiente en la base de datos de índice de acuerdo con las necesidades de consulta del usuario y se la devuelve de acuerdo a un determinado algoritmo. Con el fin de garantizar la exactitud y actualidad de la información buscada por los usuarios. Para un motor de búsqueda independiente, es necesario establecer y mantener una enorme base de datos. La información contenida en las bases de datos indexadas de motores de búsqueda independientes es rastreada periódicamente en Internet mediante programas de software llamados arañas. Al visitar cada sitio en el área pública de la red pública, se recopilan recursos de información de la red y luego el software de índice indexa automáticamente la información recopilada y crea una base de datos de índice de páginas web para que los usuarios consulten según las palabras clave que proporciona el software de búsqueda. a los usuarios información a través de la base de datos del índice Proporcionar servicios de consulta. Por lo tanto, un motor de búsqueda general consta principalmente de tres partes: arañas web, indexación y software de búsqueda.
Araña de tela. Es un programa muy poderoso que verificará periódicamente la página web correspondiente de acuerdo con la dirección preestablecida. Si la página web cambia, volverá a buscarla; de lo contrario, continuará visitando de acuerdo con los enlaces de la página web. El proceso por el que las arañas web acceden a las páginas web es el proceso de atravesar información en Internet. Para garantizar la amplitud de la información atravesada, las arañas web generalmente configuran algunos enlaces importantes con anticipación y luego los atraviesan. Durante el proceso de recorrido, los enlaces en la página web se registran continuamente y el recorrido continúa hasta que se visitan todos los enlaces.
Software de indexación. Las arañas web almacenan páginas web obtenidas recorriendo conjuntos de búsqueda en una base de datos. Para mejorar la eficiencia de la recuperación, es necesario crear un índice. El índice es generalmente un índice invertido.
Software de búsqueda. Este software se utiliza para filtrar innumerables páginas web en la base de datos de índice, seleccionar y ordenar páginas web que cumplan con los requisitos de búsqueda del usuario. Los resultados ordenados jerárquicamente se muestran al usuario.
3 Principales indicadores de evaluación del rendimiento de los motores de búsqueda
3.1 Método de indexación del motor de búsqueda El índice en la base de datos generalmente se almacena en el formato de archivo del documento invertido. Los diferentes motores de búsqueda tienen diferentes requisitos. a la hora de establecer índices. Algunos motores de búsqueda crean índices de texto completo para páginas de información; mientras que otros solo crean partes de resumen o índices al principio de los párrafos, algunos motores de búsqueda, como Google, también consideran los diferentes significados expresados por diferentes etiquetas de hipertexto al crear índices. Los elementos que se muestran en negrita y con fuentes grandes tienden a ser más importantes; la información colocada en la cadena de anclaje suele ser un resumen de la información de la página a la que apunta y, por lo tanto, sirve como información importante para la página a la que apunta. Google e infoseek también recopilan hipervínculos en páginas durante el proceso de indexación. Estos hipervínculos reflejan la estructura espacial de la información recopilada y el uso de estos resultados puede mejorar la precisión al juzgar la relevancia de la página. Debido a los diferentes índices, los resultados variarán al recuperar información.
3.2 Funciones de búsqueda de los motores de búsqueda El número de funciones de búsqueda admitidas por los motores de búsqueda y la calidad de su implementación determinan directamente la calidad de la recuperación.
Por lo tanto, además de admitir funciones de búsqueda básicas como la búsqueda booleana, la búsqueda de proximidad, la búsqueda por truncamiento de palabras y la búsqueda de campos, las herramientas de búsqueda en red también deben basarse en recursos de información en línea...>;& gt
Pregunta 2: Busque ¿Cuáles son los requisitos de la herramienta? Herramientas de búsqueda: indexa características externas (como nombre, autor, fuente, fecha de publicación, etc.). ) y características internas (como tema, tema, etc.), y organiza científicamente todas las características en un orden determinado, indicando así la ubicación del documento a los lectores y proporcionando herramientas para buscar y encontrar los documentos requeridos. Pueden ser libros, tarjetas, películas, cintas.
En términos generales, la herramienta de búsqueda debe cumplir las siguientes condiciones:
(1) Descripción detallada de las características externas y de contenido de la información bibliográfica recopilada. (Incluyendo elementos como título del libro, título del libro, autor, tema, número de clasificación, resumen, fuente, etc.).
(2) Cada elemento está marcado con una marca de búsqueda. Tales como: número de clasificación, título, palabras clave, encabezamientos de materia, número de serie del documento, número de código, dirección del sitio web, etc.
(3) Todos los proyectos están científicamente organizados en un todo orgánico. Al organizar todo el sistema de herramientas de búsqueda, debe estar claramente definido, detallado e interrelacionado.
(4) Tiene una variedad de métodos de búsqueda necesarios. Es decir, índices de varios sistemas como índice de clasificación, índice de materias, índice de autores e índice numérico. , para que los lectores puedan buscar más fácilmente.
(5)Aclarar el alcance de la inclusión. Explique la naturaleza de esta herramienta.
(6) La velocidad de recuperación debe ser rápida y la precisión de los resultados de la recuperación debe ser alta.
(7) Tiene funciones de corrección de errores y recomendación. Avisar proactivamente a los usuarios cuando ingresan términos de búsqueda incorrectos; recomendarles información relacionada con el tema de búsqueda.
Pregunta 3: ¿Cuáles son las funciones de la búsqueda avanzada de Baidu? Dé un ejemplo para ilustrar su aplicación. No sé de cuál estás hablando.
Búsqueda avanzada de Baidu News
La herramienta de búsqueda de Baidu Search puede buscar por hora, tipo de página web y nombre de dominio especificado.
Pregunta 4: ¿Cuáles son las principales funciones de los buscadores?
La función de búsqueda básica de Question Cnki es de 5 puntos. Las funciones de búsqueda básicas de CNKI incluyen búsqueda primaria y búsqueda secundaria, de la siguiente manera:
1 Búsqueda principal
Navegación y recuperación: los usuarios no necesitan ingresar ningún término de búsqueda, solo seleccionar. Puede buscar directamente artículos sobre el tema que desee utilizando el nombre de la columna que le interese.
Búsqueda de título: Recupera artículos donde aparece el término buscado en el título del artículo.
Búsqueda de autores: Busca artículos publicados por autores.
Búsqueda de palabras clave: busque artículos utilizando términos de búsqueda en las palabras clave del artículo.
Búsqueda institucional: Ingrese el nombre de una institución para buscar artículos publicados por autores de esa institución.
Búsqueda de resúmenes en chino: busque artículos utilizando términos de búsqueda en su resumen en chino.
Búsqueda de títulos chinos: Búsqueda de artículos publicados en revistas.
Búsqueda anual: Busca artículos en un año determinado.
Búsqueda de revistas: Busca artículos en un determinado número.
Búsqueda de texto completo: busca artículos con términos de búsqueda en el texto completo (incluidos todos los artículos).
2. Segunda búsqueda
Para los resultados de búsqueda de cualquier método en 1, puede utilizar nuevos términos de búsqueda para realizar búsquedas aproximadas continuas dentro de este rango de búsqueda.
Pregunta 6: ¿Qué herramientas de búsqueda son mejores para buscar documentos? ¿Algún consejo para preguntar? Busque en línea directamente con EndNote.
La palabra clave 1 generalmente se puede separar por espacios y se pueden utilizar comillas para buscar una frase. "-" representa palabras clave negativas. También se pueden utilizar AND, OR, etc. Realizar una búsqueda lógica.
Algunas bases de datos se buscan por entrada, es decir, se rellena un término de búsqueda para cada entrada y se selecciona la opción deseada en el menú desplegable.
Las bases de datos anteriores casi lo han cubierto y otras bases de datos básicamente no son necesarias. Otro consejo es utilizar Google Scholar para buscar literatura relevante. También puede ir a la página de inicio de la revista para buscar y descargar.
Pregunta 7: ¿Cuál es el papel de la búsqueda bibliográfica? La recuperación de información se refiere al proceso de obtención de documentos de acuerdo a las necesidades de estudio y trabajo.
La función es la siguiente, entonces:
Pregunta 8: ¿Cuáles son los componentes de un buscador y cuáles son sus funciones? En realidad, un sitio web sólo consta de dos partes y los motores de búsqueda no son una excepción.
Lado de la PC y lado del servidor
Lo que quieres preguntar es cuántos componentes hay en el lado del servidor.
1. Arañas, reptiles
2. Base de datos,
3. Programa de algoritmos
Es muy sencillo dominar la base de datos.
p>
El rastreo sólo se encarga de rastrear páginas características.
La base de datos sólo se encarga de almacenar las páginas capturadas.
El algoritmo es relativamente complejo.
En lo que respecta a Baidu, debería haber más de 300 algoritmos, grandes y pequeños.
El algoritmo principal se divide en las siguientes partes.
Algoritmo de enlace, algoritmo de contenido, algoritmo de nombre de dominio, algoritmo anti-trampas, etc.
El algoritmo de enlace representa la mayor proporción.
Pregunta 9: ¿Cuáles son los tipos básicos de motores de búsqueda comúnmente utilizados? Un motor de búsqueda es un sistema que recopila y organiza recursos de información en Internet y luego los proporciona para que usted los consulte. Incluye tres partes: recopilación de información, clasificación de información y consulta del usuario.
Los motores de búsqueda son sitios web que le brindan servicios de "recuperación" de información. Utiliza algunos programas para clasificar toda la información en Internet y ayudar a las personas a encontrar la información que necesitan en la vasta red.
Los primeros motores de búsqueda recopilaban las direcciones de los servidores de recursos en Internet, dividían los recursos que proporcionaban en diferentes directorios y luego los clasificaban capa por capa. Las personas que quieran encontrar la información que desean pueden ingresar capa por capa de acuerdo con su propia clasificación y finalmente llegar al destino y encontrar la información que desean. En realidad, este es el método más primitivo y sólo es aplicable cuando no hay mucha información en línea. Con el crecimiento geométrico de la información en Internet, han surgido verdaderos motores de búsqueda. Estos motores de búsqueda conocen el comienzo de cada página del sitio web, luego buscan todos los hipervínculos en Internet y colocan todas las palabras que representan los hipervínculos en una base de datos. Este es el prototipo del motor de búsqueda actual.
Usa Yahoo! Con la aparición de Internet, el desarrollo de los motores de búsqueda también ha entrado en una era dorada y su rendimiento es mejor que antes. Los motores de búsqueda actuales no sólo buscan información en la web, sino que se han vuelto más completos y sofisticados. Con la autoridad del motor de búsqueda Yahoo! Por ejemplo, a partir de marzo de 1995, Yahoo fue fundado por el chino-estadounidense Jerry Yang y otros. Desde el principio hasta el presente, se han desarrollado desde un único motor de búsqueda hasta una variedad de servicios de red, como el comercio electrónico, los servicios de información de noticias y los servicios de correo electrónico personales gratuitos, lo que ilustra completamente el proceso de desarrollo del motor de búsqueda desde uno único hasta uno completo. .
Sin embargo, debido al modelo de funcionamiento de los motores de búsqueda y al rápido desarrollo de Internet, los resultados de búsqueda son cada vez más insatisfactorios. Por ejemplo, la búsqueda de la palabra "computadora" puede mostrar millones de páginas. Esto se debe a que los motores de búsqueda optimizan los resultados de búsqueda a través de la relevancia del sitio web, y la relevancia del sitio web está determinada por fórmulas como la posición de la palabra clave en el sitio web, el nombre del sitio web, las etiquetas, etc. Por eso los resultados de búsqueda de los motores de búsqueda son numerosos y variados. Debido al desarrollo y los cambios de Internet, las bases de datos de los motores de búsqueda inevitablemente contienen enlaces inactivos.
En este artículo presentamos Google, que es un prototipo de un gran motor de búsqueda. Los motores de búsqueda se utilizan ampliamente para el hipertexto. Google está diseñado para rastrear e indexar páginas web de manera eficiente y los resultados de sus consultas son mejores que otros sistemas existentes. La base de datos de hipervínculos y texto completo de este prototipo contiene al menos 24.000.000 de páginas web. Podemos descargarlo desde google.stanford.edu/.
Diseñar un motor de búsqueda es un trabajo desafiante. Los motores de búsqueda indexan miles de millones de páginas web que contienen una gran cantidad de palabras muy diferentes. Responda miles de preguntas todos los días. En Internet, aunque los grandes motores de búsqueda son muy importantes, rara vez se estudian en los círculos académicos. Además, debido al rápido desarrollo de la tecnología y al gran número de páginas web, crear un motor de búsqueda es completamente diferente ahora que hace tres años.
Este artículo detalla nuestro gran motor de búsqueda. Hasta donde sabemos, este es el primer artículo publicado que lo describe con tanto detalle. Además de los problemas encontrados al aplicar técnicas tradicionales de búsqueda de datos a una cantidad tan grande de páginas web, existen muchos desafíos técnicos nuevos, incluida la aplicación de información adicional en hipertexto para mejorar los resultados de búsqueda.
Este artículo abordará este problema y describirá cómo utilizar información adicional en hipertexto para construir un sistema práctico de gran tamaño. Cualquiera puede publicar información en Internet a voluntad. Cómo abordar eficazmente estos hipertextos desorganizados también es una cuestión a la que este artículo debe prestar atención.
World Wide Web, motor de búsqueda, recuperación de información, PageRank, Google 1 Introducción La Web plantea nuevos desafíos a la recuperación de información. La cantidad de información en Internet aumenta rápidamente y, al mismo tiempo, usuarios nuevos e inexpertos están experimentando el arte de Internet. A la gente le gusta utilizar hipervínculos para navegar por la web, normalmente comenzando con páginas web importantes o motores de búsqueda como Yahoo. Todos están de acuerdo;
Pregunta 10: ¿Cuál es la diferencia entre un libro de referencia de búsqueda y un libro de referencia de referencia? Los libros de referencia son manuales que recopilan conocimientos e información para que los lectores encuentren explicaciones de palabras y sustantivos. Los libros de referencia proporcionan a las personas documentos específicos, diccionarios, resúmenes geográficos e información general. La información específica y práctica proporcionada por la empresa incluye vocabulario difícil, explicaciones de términos profesionales, herramientas de almacenamiento y recuperación de información bibliográfica, libros de referencia de búsqueda, etc., que la gente utiliza para informar.
La herramienta de búsqueda sólo proporciona pistas, enciclopedias e información bibliográfica.