Directoris,cercadors i metacercadors (cercadors múltiples).

Instruments de cerca d’informació

Els diferents serveis de cerca d’informació a Internet es poden classificar en: directoris, cercadors i metacercadors (cercadors múltiples).

Directoris

Un índex o directori és una recopilació manual de documents que classifica adreces d’altres pàgines Web, organitzant-les temàticament. Existeixen nombrosos directoris, uns de generals com l’Open Directory Project elaborat per la pròpia comunitat d’Internet. Un altre directori de l’àmbit lingüístic català és el Cercador. Finalment hi ha directoris que sols cobreixen un camp molt específic com els directoris telefònics o Softcatalà, un directori de programari lliure.

Cercadors

Un cercador (en anglès “search engine”) és un programa que fa cerques dins una base de dades. En el cas que ens ocupa, la base de dades és de documents web. La base de dades es construeix gràcies a un programes anomenats “robots”. Els robots són programes encarregats de fer buidats periòdics de les pàgines web. També se’ls anomena “aranyes” pel fet que viatgen per la “teranyina”. La seva finalitat és la de visitar els ordinadors que emmagatzemen informació d’accés públic, indexar-la i enviar aquest índex a l’ordinador matriu on es sumen tots els índexs alimentant de forma automàtica una gran base de dades documental.
Fer una cerca a la web vol dir fer una consulta a una base de dades documental creada per una empresa o entitat que manté el cercador (n’hi ha més d’un miler). El motor de cerca rep la interrogació de l’usuari que consisteix en una o més paraules, fa la cerca a la seva base de dades i extreu una llista ordenada de documents que compleixen, totalment o en part, la interrogació formulada. L’ordre d’aparició dels resultats depèn d’una puntuació que associa el programa a cada document quan fa la cerca, i varia segons el cercador.
Existeixen nombrosos cercadors a la web que es diferencien per:

  • la quantitat de vegades que refresquen la informació del seu índex (tinguem en compte que la informació a la web és molt dinàmica: hi ha altes i baixes de pàgines contínuament).
  • la quantitat d’informació que emmagatzemen de cada pàgina web que el robot visita. Hi ha cercadors que sols es fixen en el títol, d’altres en els descriptors (si n’hi ha) i d’altres en tot el text.
  • l’àmbit que cobreixen: hi ha cercadors d’abast universal i d’altres que sols recullen informació d’un àmbit geogràfic, temàtic o d’edats concret.

Els cercadors generalistes més importants són:

Cercadors de l’àmbit lingüístic català (entre altres):

Cercadors especialitzats per a infants

També trobareu cercadors que mostren els resultats d’una cerca en forma de mapes conceptuals:

Metacercadors

Cerquen una mateixa informació simultàniament a diferents cercadors. Envien la consulta que hem formulat a diversos cercadors i van classificant les respostes a mida que van arribant. Els més eficients eliminen els duplicats. Solen ser de menors prestacions que els cercadors individuals (més lents, amb menys recursos per cerques avançades) però simplifiquen la realització de cerques múltiples cosa molt útil en un primer nivell de cerca.
Search.com tramet una mateixa cerca als principals cercadors: Google, Ask Jeeves, LookSmart entre altres.

Hi ha metacercadors interessants perquè proporcionen resultats de dimensions abastables, com Mamma i Beaucoup. Aquests, agreguen i prioritzen la informació que els proporcionen els cercadors, i finalment donen els resultats en base a determinats algorismes interns de qualitat i de rellevància, reduint de manera significativa el nombre de respostes.

Answers aparegut només fa un any, és un metacercador que combina la seva funcionalitat amb la d’una enciclopèdia, donant respostes, com el seu propi nom indica, en forma de definicions i descripcions a qualsevol tema que se li plantegi.

SearchEngineWatch és un lloc que dóna molta informació sobre cercadors i estratègies per a que els autors de pàgines web puguin donar a conèixer millor la seva pàgina a través dels cercadors.

Cerca a la web “invisible”

La informació localitzable amb els cercadors esmentats, també anomenada “web visible”, és sols la punta de l’iceberg del volum total de la d’informació disponible a Internet. La informació no cercable per aquests mitjans (bases de dades, catàlegs de biblioteques, webs dinàmiques, …) anomenada “Web invisible”, requereix d’eines de cerca específiques.

Per facilitar l’accés a la informació invisible, moltes Webs disposen d’un cercador intern de la pròpia Web. Per exemple la XTEC o Gencat disposen d’un cercador web propi que trobareu a la respectives pàgines d’acollida. D’altres cercadors sols són utilitzables si som usuaris registrats.

Alguns cercadors faciliten la cerca sobre bases de dades i plublicacions, no accessibles pels buscadors convencionals:

Alguns consells generals per facilitar les cerques

Els consells que segueixen funcionen amb la majoria dels cercadors, el criteri principal de llur utilització és el de reduir el “soroll” és a dir les respostes no significatives en una cerca.

Com a primera indicació cal recordar que no tots els cercadors recullen la mateixa informació: si volem ser exhaustius, s’imposa repetir la cerca a més d’un lloc.

Els consells que aquí s’indiquen són força universals però potser que amb algun cercador concret no funcionin. En aquest cas mireu les indicacions sintàctiques del cercador (caldria fer-ho normalment en tots els casos).

  • Cerca de noms propis: Poseu en majúscula la inicial. Els cercadors distingeixen entre majúscules i minúscules. L’ús de majúscules és més restrictiu.
  • Per trobar documents que continguin dos o més termes separeu-los amb el signe +
  • Cerca de diversos termes relacionats: poseu una coma per separar-los.
  • Empreu cometes per buscar frases o expressions completes.
  • Si dos termes normalment estan separats per un sol mot empreu el guió per connectar-los.
  • Empreu [claudàtors] per indicar que dos termes han d’estar separats com a màxim per 100 mots o en el mateix paràgraf.
  • Cerca de fitxers d’un format concret: poseu l’expressió “filetype:pdf” dins la cerca per filtrar sols els documents de tipus PDF
  • Cerca en camps concrets: Title: “Wall Street Journal” o text:
  • Per trobar els derivats d’un terme empreu el caràcter * (truncament).
  • Per localitzar adreces (URL “Uniform Resource Locator”) empreu url:expressió.

Un cop hem localitzat la informació, podem creure tot el que trobem a Internet?

Atesa la facilitat de publicar a la Web i la manca de control sobre els continguts que es publiquen, és a l’usuari a qui li pertoca valorar la fiabilitat de la informació que troba a la xarxa. Aquesta no és una tasca fàcil: en general tendim a creure les informacions presentades dins un embolcall ben presentat, això afecta especialment a infants i adolescents. Cal advertir als alumnes d’aquest fet, i dissenyar activitats d’aprenentatge que impliquin el contrast de punts de vista i informacions entre diverses fonts (i suports) amb l’objectiu que l’alumnat es formi com a consumidor crític d’informació.

Podem considerar que les destreses de cerca d’informació a la web són una nova categoria de procediments informacionals. Procediments perquè constitueixen un ventall d’estratègies i destreses que són susceptibles d’aprendre’s, i informacionals perquè capaciten per cercar, seleccionar, interpretar i elaborar informació. Els procediments informacionals no són una novetat d’ara, són inherents al treball escolar i al treball intel·lectual: consultar diccionaris, saber moure’s per una biblioteca, extreure la informació rellevant d’un document, presentar dossiers ben estructurats…. Per tot l’esmentat, les estratègies de cerca a la web haurien de constituir una nova competència bàsica.

El futur de la cerca a la Web

La modalitat de cerca més habitual, és la que comporta una actitud activa de l’usuari cercant amb els cercadors esmentats. Una modalitat emergent i alternativa de cerca, és aquella en que la informació ens ve a buscar a nosaltres sense necessitat de cercar-la, simplement la rebem si prèviament hem definit el nostre ventall d’interessos o perfil de necessitats.

Aquesta segona modalitat es basa en la tecnologia anomenada RSS, un acrònim anglès polisèmic (Really Simple Syndication, Rich Site Summary ) que podríem traduir per “Canal de difusió de titulars”. Es tracta d’un senzill mecanisme tecnològic, basat en XML, que facilita estar al dia de les novetats que es publiquen als vostres llocs web preferits, sense necessitat de visitar-los periòdicament. Un cop us subscriviu a un canal RSS, rebreu periòdicament noticies de les actualitzacions de la corresponent pàgina web. Els primers canals RSS sols eren textuals, després van incorporar imatges, ara n’hi ha que porten associats fitxers de so i han donat lloc al fenomen del “Podcasting“.

Per llegir els canals RSS cal un programa lector. A Internet trobareu una amplia gamma de programari per llegir RSS. Es poden classificar en tres categories: els lectors RSS locals que s’instal·len al ordinador, els lectors que s’integren com una extensió del navegador o del correu i els lectors online que sols impliquen donar-vos d’alta al proveïdor del servei. Us en recomano dos: el WizzRSS és una extensió pel navegador Firefox i el tindreu sempre a ma quan navegueu. La segona opció és l’agregador web Bloglines. Aquest servei gratuït, és accessible des de qualsevol ordinador connectat a la xarxa, aquesta modalitat és més avantatjosa per als qui naveguen des de diferents ordinadors.

Per subscriure’s a un canal RSS, arrossegueu amb el ratolí la icona etiquetada amb “RSS” o “XML” al vostre lector. Completeu la informació que us demani (dependrà del lector utilitzat) i se us afegirà a la llista de canals. A partir d’aquest moment, cada cop que es publiqui una aportació, rebreu la notícia al vostre lector.

Fernandez, J. I Vivancos,J. (1998). “Internet com a font de recursos educatius”. Actualització del text: “Internet: introducció a la cerca a la web“. [http://www.xtec.net/~jvivanco/cerca.htm]. (25.02.2008). Actualitzaciód’enllaços CRP del Baix Ebre

 

 

 

 

Deixa un comentari