martes, 6 de abril de 2010

Que Son los Motores De Busqueda

Motor De Busqueda

Un motor de búsqueda es un sistema informático que busca archivos almacenados en servidores web gracias a su «spider» Un ejemplo son los buscadores de internet cuando se pide información sobre algún tema. Las búsquedas se hacen con palabras clave o con árboles jerárquicos por temas; el resultado de la búsqueda es un listado de direcciones web en los que se mencionan temas relacionados con las palabras clave buscadas.

Como operan en forma automática, los motores de búsqueda contienen generalmente más información que los directorios. Sin embargo, estos últimos también han de construirse a partir de búsquedas (no automatizadas) o bien a partir de avisos dados por los creadores de páginas (lo cual puede ser muy limitante). Los buenos directorios combinan ambos sistemas. Hoy en día internet se ha convertido en una herramienta, para la búsqueda de información, rápida, para ello han surgido los buscadores que son un motor de búsqueda que nos facilita encontrar información rápida de cualquier tema de interés, en cualquier área de las ciencias, y de cualquier parte del mundo
Existen tres tipos de buscadores:


Spiders de búsqueda, o buscadores propiamente dichos.
Directorios Índices, Catálogos que agrupan sus enlaces por categorías
Sistemas Mixtos spiders tienen un directorio, además de su motor de búsqueda.
Otros sistemas Otros sistemas de búsqueda menos importantes.
  1. Los Spiders: La mayoría de grandes sitios internacionales que todos usamos y conocemos son de este tipo. Requieren muchos recursos para su funcionamiento. No están al alcance de cualquiera.
    • Recorren las páginas recopilando información sobre los contenidos de las páginas. Principalmente el texto que en ellas aparece. Cuando buscamos una información ellos consultan con su software en su base de datos, con la información que han recogido de las páginas, y nos la presentan clasificados por su relevancia. De las webs, los buscadores pueden almacenar desde la página de entrada, a todas las páginas de la web. Depende de los gustos del buscador, y la consideración de importancia que tenga la web para ellos.
    • Si buscamos una palabra, por ejemplo [ordenadores]. En los resultados que nos ofrecerá el motor de búsqueda, aparecerán páginas que contengan esta palabra en alguna parte de su texto.
    • Si consideran que una web es importante para el usuario, tienden a registrarlas todas. Si no la consideran importante, solo almacenan una o mas páginas. Aunque no necesariamente registran todas las webs que lo soliciten.
    • Cada cierto tiempo, el software revisa las webs indexadas, para actualizar los contenidos de su base de datos, por lo que no es infrecuente, que los resultados de la búsqueda no estén actualizados, de forma que la información o la página no exista.
    • Los spiders, tienen una colección de programas simples y potentes con diferentes cometidos. Se suelen dividir en tres partes. Los programas que exploran la red -spiders-. Los que construyen la base de datos. Y los que utiliza el usuario, el programa que explora la base de datos.
    • La relevancia ó orden de presentación de los resultados de la consulta, viene determinada por diversos factores que dependen de cada buscador. Sería demasiado prolijo tratar lo que consideran por relevancia, pero vamos a enumerar unas pocas. El tráfico, puede ser un factor de relevancia. El tipo de web, y la información que contienen son otros factor importantes, debido al análisis que realizan del contexto.
    • Otro factor para la relevancia, común a muchos portales y sitios de internet, es: si pagamos para tener una mayor visibilidad en los resultados de la búsqueda. Es decir si les pagamos nos dan un bonus que nos permitirá aparecer en las primeras páginas de resultados. Esta forma de publicidad, ahora mismo, es indicada de alguna forma. Los spiders se han visto obligados a este tipo de publicidad para poder seguir ofreciendo a los usuarios el servicio de forma gratuita.
    • Ejemplos de Spiders: Google, Altavista, Hotbot, Lycos
  2. Los Directorios:
    Una barata tecnología, que es ampliamente utilizada por la cantidad de programas scripts en el mercado. No se requieren muchos recursos de informática. Están muy extendidos en la red por estos motivos. En cambio, se requiere mas soporte humano y mantenimiento.
    • Son completamente distintos a los spiders. En estos, los algoritmos son mucho mas sencillos, presentando la información sobre las webs registradas como una colección de directorios. No recorren las webs ni almacenan sus contenidos. Solo registran algunos de los datos de nuestra página. Como el título y la descripción de la web que se introduzcan a la hora de registrar las webs.
    • Los resultados de la búsqueda, estarán determinados por la información que se haya suministrado al directorio cuando se registra la web. En cambio, a diferencia de los spiders, son revisadas por operadores humanos, y clasificadas según categorías, de forma que es mas fácil encontrar webs de el tema de nuestro interés.
    • Mas que buscar información sobre contenidos de la página, los resultados serán presentados haciendo referencia a los contenidos y temática de la web. Es decir, si buscamos "ordenadores", aparecerán webs que de una forma u otra estén relacionados con la temática de ordenadores. Sus posibilidades de búsqueda de contenidos, en la mayoría de los casos, son inexistentes.
    • Su tecnología, es muy barata y sencilla. Imagínese que es una base de datos como la que usted utiliza, sobre la que se realizan búsquedas. Tiene un coste de operación relativamente alto, pues tiene que ser operado por humanos práctica y exclusivamente.
    • Son apropiados para buscar categorías, mas que informaciones específicas. Para visitar sitios de temática común. Es la tecnología que utilizan portales y sitios web de sectores especializados como economía, derecho, naturaleza, deportes, famosos, humanidades, .. ..
    • Ejemplos de directorios: Antigus directorios, Yahoo, Terra (Antíguo Olé). Ahora, ambos utilizan tecnología spider, y Yahoo, conserva su directorio. Buscar Portal, es un directorio, y la mayoría de sitios hispanos son directorios.
  3. Los sistemas mixtos Buscador - Directorio:
    Son una mezcla entre spider y directorio. Además de tener características de arañas, presentan las webs registradas en catálogos sobre contenidos. Informática, cultura, sociedad. Que a su vez se dividen en subsecciones.

    Ejemplo de sistema mixto Excite, Voila, Infoseek. Los sistemas en la actualidad, suelen tender hacia métodos mixtos como ha ocurrido con Altavista. Aunque también intentan parecerse a google.
  4. Metabuscadores
    Metabuscadores. Lo que hacen, es realizar búsquedas en otros sitios, analizan los resultados de la página, y presentan sus propios resultados.
    No suelen ser bien venidos por los portales. Para utilizar los servicios gratuitos de un buscador de esta forma, es necesario pedir permiso. El motivo es el siguiente:
    El Buscador, pone el dinero para opera el servicio, los contenidos que utilizará el metabuscador, y no percibe nada a cambio. Al eliminar la publicidad, no se obtienen ingresos. Solo gasto y pérdida de visitantes que utilicen este servicio de búsqueda.
  5. Multibuscadores
    Es una categoría que oficialmente, no existe. Digamos que no está muy extendida, y que he puesto aquí, porque nosotros lo utilizamos. Permite lanzar varias búsquedas en webs seleccionados respetando el formato original de los resultados. Hemos desarrollado nuestra propia tecnología de multibuscadores.
  6. FFA Enlaces gratuitos para todos
    FFA, página de enlaces gratuitos para todos. Cualquiera puede inscribir su página durante un tiempo limitado en estos pequeños directorios. Los enlaces, no son permanentes.
  7. Buscadores de Portal
    Bajo este título, englobamos los sistemas específicos de sitio. Aquellos que buscan información solo en su portal o sitio web. Podríamos considerarlos como un directorio. No obstante, como están basados en expresiones regulares y consultas SQL, vamos a intentar ayudarles a manejar mejor estas herramientas.
    Si trabaja en temas de administración, sabrá por experiencia la necesidad de conocer bien estos sistemas, a los que no se da la importancia que requieren