Un rastreador web, anteriormente llamado araña, es un programa (o script) de robot que navega automáticamente por la World Wide Web y obtiene información de acuerdo con ciertas reglas. Alguna vez fue ampliamente utilizado en los motores de búsqueda de Internet. Cualquiera que haya utilizado Internet y un navegador sabe que, además de información de texto para que los usuarios la lean, las páginas web también contienen algunos hipervínculos. El sistema de rastreo web obtiene continuamente otras páginas de la red a través de la información del hipervínculo en la página web. Debido a esto, el proceso de recopilación de datos de la red es como un rastreador o una araña deambulando por la red, por lo que se le llama vívidamente rastreador web o araña web.