El antepasado de todos los motores de búsqueda fue inventado por tres estudiantes de la Universidad McGill de Montreal (Alan Entachi, Peter Deutsch y Bill Whelan) en 1990 Archie FAQ. Alan Emtage y otros pensaron en desarrollar un sistema que pudiera encontrar archivos por nombre, así nació Archie. Archie es el primer programa que indexa automáticamente archivos anónimos de sitios web FTP en Internet, pero no es un verdadero motor de búsqueda. Archie es una lista de búsqueda de nombres de archivos FTP. El usuario debe ingresar el nombre exacto del archivo que desea buscar y Archie le indicará desde qué dirección FTP se puede descargar el archivo. Inspirados por la popularidad de Archie, los Servicios de Computación del Sistema de la Universidad de Nevada desarrollaron Veronica (Veronica FAQ), una herramienta de búsqueda de Gopher (Gopher FAQ) en 1993. Jughead es otra herramienta de búsqueda de tuzas posterior.
Edite el desarrollo de los motores de búsqueda en este párrafo:
Desarrollo (1):
El primer programa araña del mundo, Web Wanderer de Matthew MIT Gray, solía seguir la escala del crecimiento de Internet. Al principio, solo se usaba para contar la cantidad de servidores en Internet. Posteriormente, fue desarrollado para capturar URL. Los motores de búsqueda generalmente constan de las siguientes tres partes: generador de índices de rastreador (robot, araña) y recuperador de consultas.
Desarrollo (2):
La historia de Excite se remonta a febrero de 1993. La idea de seis estudiantes de la Universidad de Stanford era analizar las relaciones entre palabras para poder buscar de forma más eficiente en las grandes cantidades de información de Internet. A mediados de 1993, el proyecto estaba completamente comprometido y lanzaron una versión del software de búsqueda para que los webmasters lo usaran en sus propios sitios, que se conoció como Excite for Web Servers. Nota: Excite luego se hizo famoso por la búsqueda de conceptos. En mayo de 2002, Excite, adquirida por Infospace, detuvo su propio motor de búsqueda y cambió al metabuscador Dogpile.
Desarrollo (3):
En abril de 1994, dos estudiantes de doctorado chino-estadounidenses de la Universidad de Stanford, Jerry Yang y David Filo, cofundaron Yahoo! . A medida que aumentó el número de visitas y enlaces, el Directorio de Yahoo comenzó a admitir búsquedas simples en bases de datos. Porque Yahoo! Los datos se introducen manualmente, por lo que realmente no se pueden clasificar como motor de búsqueda. De hecho, es sólo un directorio de búsqueda. Yahoo! Dado que todos los sitios web incluidos en el sitio web van acompañados de información breve, la eficiencia de la búsqueda mejora significativamente. Nota: Después de Yahoo, Altavista, Inktomi y Google proporcionarán sucesivamente servicios de motores de búsqueda. Yahoo! ——Casi se convirtió en sinónimo de Internet en la década de 1990.
Desarrollo (4):
En 1995, apareció una nueva forma de motor de búsqueda: el metabuscador. Los usuarios solo necesitan enviar una solicitud de búsqueda una vez, y el metabuscador es responsable de la conversión y el procesamiento antes de enviarla a múltiples motores de búsqueda independientes preseleccionados. Todos los resultados de las consultas devueltos por los motores de búsqueda independientes se recopilan y procesan antes de devolverlos al sitio. usuario. El primer metabuscador fue Metacrawler de Eric Selberg y Liu Wenhuan Etzioni, estudiantes de maestría de la Universidad de Washington. Los metabuscadores parecen buenos en concepto, pero los resultados de búsqueda siempre son insatisfactorios, por lo que ningún metabuscador ha tenido nunca una posición fuerte.
Desarrollo (5):
La aparición de la recuperación inteligente: uso de diccionarios de segmentación de palabras, diccionarios de sinónimos y diccionarios homófonos para mejorar los resultados de la recuperación, lo que puede ayudar aún más a las consultas a nivel de conocimiento. o nivel conceptual. Mediante el procesamiento de recuperación de diccionarios temáticos, diccionarios superiores y diccionarios relacionados del mismo nivel, se forma un sistema de conocimiento o red de conceptos, que brinda a los usuarios consejos de conocimiento inteligentes y, en última instancia, los ayuda a obtener los mejores resultados de recuperación.
Ejemplo: (1) La consulta "computadora" también puede recuperar información relacionada con "computadora" (2) El alcance de la consulta se puede limitar aún más a "microcomputadora", "servidor" o expandirse a "tecnología de la información" o "tecnología electrónica" relacionada; ", "software", "aplicaciones informáticas"; (3) también incluye información ambigua y procesamiento de recuperación, como si "Apple" se refiere a una fruta o a una marca de computadora, y la distinción entre "chino" y "República Popular China". (PRC)" Se procesará combinando tecnologías como la base de datos de descripción de conocimientos ambiguos, el índice de texto completo, el análisis del contexto de búsqueda de los usuarios y la retroalimentación relacionada con el usuario, para brindar de manera eficiente y precisa la información más necesaria a los usuarios.
Desarrollo (6):
La tendencia de personalización es una de las características importantes y tendencias inevitables del desarrollo futuro de los motores de búsqueda. Una forma es organizar la información personal a través de los productos comunitarios del motor de búsqueda (es decir, proporcionar servicios a usuarios registrados) y luego introducir factores personales en la recuperación de la base de datos de información básica del motor de búsqueda para su análisis, obteniendo así diferentes resultados de búsqueda para individuos. Desde el lanzamiento de la versión beta de myweb por parte de Yahoo en junio 5438 065438 octubre de 2004, hasta el lanzamiento de la función de personalización en junio 5438 065438 octubre de 2005, el historial de búsqueda de Google siguió básicamente el mismo camino, analizando el alcance limitado de las necesidades de búsqueda específicas de los usuarios. y luego expandió a Internet otros sitios web similares en el sitio web, brindando los resultados más relevantes según el alcance de las necesidades del usuario. El otro es para el popular motor de búsqueda personalizado Google, o yahooMindSet, o vivisimo, que todos sabemos es la agrupación de prospectos. Pero no importa qué método de implementación se utilice, es decir, Google elige activamente el alcance de la búsqueda o Yahoo, vivisimo reorganiza la información que necesitan en los resultados, es un experimento o una idea, y no se convertirá en una aplicación de motor de búsqueda convencional en un corto tiempo.
Desarrollo (7):
Tecnología de red global grande: dado que no existe un estándar de organización de información unificada para procesar recursos de información de red, los recursos de información de red desordenados son difíciles de buscar, transferir y Compartir e incluso desarrollar y utilizar en profundidad islas de información. La tecnología Grid tiene como objetivo eliminar las islas de información y lograr una conexión integral de todos los recursos en Internet. La palabra "robot" en el Global Information Grid de EE. UU. tiene un significado especial para los programadores. Un robot informático es un programa automatizado que puede realizar una tarea repetidamente a una velocidad que los humanos no pueden alcanzar. Debido a que los programas robóticos diseñados para recuperar información se arrastran por la web como arañas, los programas robóticos de los motores de búsqueda se denominan programas araña. Matthew Gray desarrolló Web Wanderer en 1993, el primer programa "robot" que utiliza las relaciones de enlace entre páginas HTML para explorar el tamaño de la World Wide Web. Al principio solo se usaba para contar el número de servidores en Internet, pero luego también pudo capturar direcciones web (URL). En abril de 1994, dos estudiantes de doctorado de la Universidad de Stanford, los chino-estadounidenses Jerry Yang y David Filo, cofundaron Yahoo. A medida que aumentó el número de visitas y enlaces, el Directorio de Yahoo comenzó a admitir búsquedas simples en bases de datos. Porque Yahoo! Los datos se introducen manualmente, por lo que realmente no se pueden clasificar como motor de búsqueda. De hecho, es sólo un directorio de búsqueda. Yahoo adquirió inktomi el 23 de febrero de 2002, Overture, incluidos Fast y Altavista, el 23 de julio de 2003, y adquirió por completo 3721 el 23 de junio de 2003. A principios de 1994, Brian Pinkerton, un estudiante de la Universidad de Washington, inició su pequeño proyecto WebCrawler. El 20 de abril de 1994, WebCrawler contenía contenido de sólo 6.000 servidores. WebCrawler es el primer motor de búsqueda de texto completo en Internet que admite la búsqueda de todas las palabras de un documento. Antes, los usuarios sólo podían buscar por URL y resumen, a menudo a partir de anotaciones humanas o programas que extraían automáticamente las primeras 100 palabras de texto.
En julio de 1994, Michael Mauldin de la Universidad Carnegie Mellon conectó el programa araña de John Leavitt a su programa de indexación y creó Lycos. Además de la clasificación por relevancia, Lycos también proporciona coincidencias de prefijos y restricciones de similitud de caracteres. Lycos fue el primero en utilizar el resumen automático de páginas web en los resultados de búsqueda. Su mayor ventaja es que la cantidad de datos supera con creces la de otros motores de búsqueda. A finales de 1994 apareció oficialmente Infoseek. Su amigable interfaz y su gran cantidad de características adicionales lo convierten en un importante representante de motores de búsqueda como Lycos. En 1995, apareció una nueva forma de motor de búsqueda: una revisión de los metabuscadores. Los usuarios solo necesitan enviar una solicitud de búsqueda una vez, y el metabuscador es responsable del procesamiento de la conversión y la envía a múltiples motores de búsqueda independientes preseleccionados. Los resultados de la consulta devueltos por cada motor de búsqueda independiente se recopilan y procesan antes de devolverlos. el usuario. El primer metabuscador fue Metacrawler de Eric Selberg y Liu Wenhuan Etzioni, estudiantes de maestría de la Universidad de Washington. 1995 65438 En febrero, DEC lanzó oficialmente AltaVista. AltaVista es el primer motor de búsqueda que admite búsquedas en lenguaje natural y el primero en implementar una sintaxis de búsqueda avanzada (como AND, OR, NOT, etc.). ).Los usuarios pueden utilizar AltaVista para buscar grupos de noticias y recuperar artículos de Internet. También pueden buscar palabras en nombres de imágenes, títulos, subprogramas Java y objetos ActiveX. AltaVista también afirma ser el primer motor de búsqueda que permite a los usuarios enviar o eliminar URL a una base de datos de índice web, y puede iniciarse en 24 horas. Una de las novedades más interesantes de AltaVista es la búsqueda de todos los sitios web con enlaces URL. AltaVista también ha realizado muchas innovaciones en la interfaz orientada al usuario. Coloca "sugerencias" en el área del cuadro de búsqueda para ayudar a los usuarios a expresar mejor su estilo de búsqueda. Estos consejos se actualizan con tanta frecuencia que después de algunas búsquedas, los usuarios verán muchas características interesantes que tal vez nunca supieron que existían. Esta serie de características han sido gradualmente adoptadas ampliamente por otros motores de búsqueda. En 1997, AltaVista lanzó LiveTopics, un sistema de presentación gráfica para ayudar a los usuarios a encontrar lo que buscan entre miles de resultados de búsqueda. El 26 de septiembre de 1995, Inktomi fue fundada por Eric Brewer, profesor asistente de la Universidad de California, Berkeley, y Paul Gauthier, estudiante de doctorado. El 20 de mayo de 1996 se fundó la empresa Inktomi y apareció ante el mundo un potente HotBot. Afirma indexar más de 65.438.100 millones de páginas por día, por lo que hay mucho más contenido nuevo que otros motores de búsqueda. HotBot también utiliza cookies para almacenar las preferencias de búsqueda personales de los usuarios. En agosto de 1997 apareció oficialmente el motor de búsqueda de auroras boreales. Solía ser uno de los motores de búsqueda más grandes en términos de base de datos. No tiene palabras vacías. Tiene excelentes noticias de actualidad, una colección especial de más de 7100 publicaciones y una buena sintaxis de búsqueda avanzada. Es el primero en admitir la clasificación automática simple de los resultados de búsqueda. Antes de 1998, Google era sólo un pequeño proyecto de la Universidad de Stanford, BackRub. En 1995, el estudiante de doctorado Larry Page comenzó a estudiar diseño de motores de búsqueda y registró el nombre de dominio el 15 de septiembre de 1997. A finales de 1997, con la ayuda de Sergey Brin, Scott Hassan y Alan S. Con la participación de Tromberg, comenzó BachRub. para proporcionar demostraciones. En febrero de 1999, Google completó la transición de la versión Alpha a la versión Beta. Google considera el 27 de septiembre de 1998 como su cumpleaños. Google determina la importancia de las páginas web basándose en Pagerank, lo que mejora enormemente la relevancia de los resultados de búsqueda. La cultura geek de Google y el no hacer el mal le han valido a Google una gran reputación y reputación de marca. En abril de 2006, Google anunció su nombre chino "Google", que fue el primer nombre dado por Google en un país de habla no inglesa.
Fast (Alltheweb) se fundó en 1997 como resultado de una investigación académica en la Universidad Noruega de Ciencia y Tecnología (NTNU). En mayo de 1999, lanzó su propio motor de búsqueda AllTheWeb. El objetivo de Fast es ser el motor de búsqueda más grande y rápido del mundo, y ha estado cerca en los últimos años. Fast (Alltheweb) puede clasificar automáticamente páginas web según ODP, admite búsquedas en Flash y PDF, admite búsquedas en varios idiomas y también proporciona búsqueda de noticias, búsqueda de imágenes, videos, MP3 y FTP, y tiene funciones de búsqueda avanzadas extremadamente poderosas. (El 25 de febrero de 2003, Overture adquirió el departamento de búsqueda en Internet de Fast). En agosto de 1996, Sohu se creó para crear un directorio clasificado de sitios web chinos. Alguna vez tuvo la reputación de "buscar mapas cuando salías y buscar Sohu en línea". Con el rápido aumento de los sitios web en Internet, este tipo de directorio de clasificación editado manualmente ya no es adecuado. En agosto de 2004, Sohu se convirtió en el sitio web independiente de búsqueda de nombres de dominio "Sogou", llamándose a sí mismo el "motor de búsqueda de tercera generación". Openfind se fundó en octubre de 1998. Su tecnología se originó en el laboratorio GAIS dirigido por el profesor Wu Sheng de la Universidad Nacional Chung Cheng en Taiwán. Al principio, Openfind era sólo un motor de búsqueda chino. En su apogeo, proporcionó motores de búsqueda chinos para tres portales muy conocidos: Sina, Qimo y Yahoo. Pero después del año 2000, el mercado se dividió gradualmente entre Baidu y Google. En junio de 2002, Openfind relanzó la versión beta del motor de búsqueda Openfind basado en el proyecto GAIS30, lanzó PolyRankTM y anunció que había acumulado 3.500 millones de páginas web y había comenzado a ingresar al campo de la búsqueda en inglés. Junio de 5438 En octubre de 2000, dos ex alumnos de la Universidad de Pekín, Robin Li, el inventor de la patente del análisis de hipervínculos y ex ingeniero senior de Infoseek, y su amigo Xu Yong (becario postdoctoral en Berkeley, California) fundaron Baidu en Zhongguancun, Beijing. La versión beta del motor de búsqueda Baidu se lanzó en agosto de 2001 (Baidu solo proporciona motores de búsqueda para otros sitios web de portales como Sohu, Sina, Tom, etc. El motor de búsqueda Baidu se lanzó oficialmente el 22 de octubre de 2001 y se centra en la búsqueda en chino). . Otras funciones del motor de búsqueda de Baidu incluyen: instantánea de Baidu, vista previa de páginas web/vista previa de todas las páginas web, términos de búsqueda relacionados, consejos para corregir errores tipográficos, búsqueda de mp3 y búsqueda en Flash. Después del lanzamiento del proyecto Blitzen en marzo de 2002, las actualizaciones tecnológicas se aceleraron significativamente. Posteriormente lanzó una serie de productos como Tieba, Zhizhi, mapas, estudios chinos, enciclopedias, documentos, videos, blogs, etc., que fueron bien recibidos por los internautas. El 5 de agosto de 2005 cotizó en Nasdaq con un precio de emisión de 27,00 dólares estadounidenses y el código BIDU. El precio de apertura fue de 66,00 dólares estadounidenses y cerró en 122,54 dólares estadounidenses, un aumento de 353,85, estableciendo un récord para el mayor aumento de acciones nuevas cotizadas en el mercado de valores estadounidense en los últimos cinco años. El 23 de febrero de 2003, 65438, la Búsqueda Huicong original operó oficialmente de forma independiente y se estableció la Búsqueda en China. En febrero de 2004, China lanzó el motor de búsqueda de escritorio Internet Pig 1.0. En marzo de 2006, Zhongsou cambió su nombre a Internet Pig ig (Internet Gateway). En junio de 2005, Sina lanzó oficialmente su motor de búsqueda desarrollado de forma independiente "Aiwen". Desde 2007, a Sina le encanta utilizar el motor de búsqueda Google. El 1 de julio de 2007, NetEase desarrolló de forma independiente la tecnología de búsqueda Youdao, fusionando la búsqueda integral original y la búsqueda web. Existen búsquedas web, búsquedas de imágenes y búsquedas de blogs que brindan servicios para la búsqueda NetEase. Entre ellos, la búsqueda web utiliza su propia tecnología de procesamiento de lenguaje natural, almacenamiento distribuido y computación de imágenes, que es la primera función de búsqueda avanzada basada en la marca, el modelo e incluso la temporada de la cámara; en comparación con productos similares, la búsqueda de blogs tiene capacidades completas y actualizadas; Ventajas oportunas y proporciona funciones innovadoras como "vista previa del artículo" y "archivos de blog".