[Versión castellana]

Isidro F. Aguillo

Laboratorio de Cibermetría
CCHS - CSIC Madrid

isidro.aguillo@cchs.csic.es



L'impacte dels motors de cerca sobre el web, l'estructura, la percepció i els usuaris ha estat enorme, possiblement molt més del que fins ara s'ha reconegut. Un breu recorregut històric ens permet comprovar com l'evolució dels cercadors ha modelat la nostra imatge del web i no sempre de manera correcta. En una professió de mitjancers com la nostra, el mitjancer (motor) ha abastat un protagonisme tan gran que segons els vaivens ens ha promogut (Altavista i la recerca booleana) o ens deixat de banda (qualsevol pot buscar a Google).

A mitjan els noranta, els cercadors eren meres evolucions dels sistemes de recuperació de bases de dades basats en freqüència d'aparició de termes. Tanmateix, el que funcionava en les bases bibliogràfiques semblava fallar en el web, on la rellevància i pertinència dels resultats deixava molt a desitjar. Es van sentir veus sobre la manca de control documental a la Xarxa o del caràcter caòtic dels continguts. Pocs sabien que en realitat el motor líder de l'època, Lycos, truncava per defecte i que això generava un soroll enorme que pocs atribuïen al funcionament peculiar d'aquest motor que requeria l'afegit poc intuïtiu d'un punt després del terme per fer una recerca exacta.

El 1996 arriba Altavista, que entre moltes altres novetats incorpora operadors booleans i delimitadors que imiten les possibilitats dels filtres per camps tan estimats pels documentalistes. Tanmateix, la presentació de resultats opta per un criteri, sovint passat per alt, que ofereix com a text referent dels continguts les primeres línies de cada pàgina. En documents molt llargs, pertinents a la recerca, aquest presumpte "resum" és anormalment poc descriptiu i dóna lloc a una percepció generalitzada errònia: Altavista torna molta "brossa".

Google canvia les regles: el PageRank li dóna un gran avantatge sobre Altavista i li permet deixar de banda els operadors booleans (que passen a ser implícits) en nom de la senzillesa, amb una interfície neta. A més, els textos de cada entrada ja no són les primeres línies sinó que es contextualitzen, i inclouen frases que continguin els termes de recerca. Psicològicament l'usuari sent que els resultats són més pertinents. Hi ha a més algunes raons més, especialment importants per al documentalista, que justifiquen l'èxit de Google: és més ràpid, en un moment en què encara hi havia limitacions de velocitat, i és molt més gran, la qual cosa redueix la pitjor de les nostres pors, el silenci documental.

Però l'èxit de Google també imposa restriccions a les prestacions. Hi ha milions de peticions simultànies i tots els usuaris s'han d'atendre en terminis relativament breus, per la qual cosa el temps de còmput individual està restringit. Google necessitarà temps i diners (sortida a borsa) per millorar la recerca avançada i oferir recuperacions per rangs.

Els enginyers informàtics de Google són excel·lents i els clústers de PC en els centres de càlcul sumen més de 500.000 ordinadors, però el creixement de peticions segueix obligant a certs compromisos pràctics:

Les xifres de resultats ofertes per Google són sempre aproximacions, de vegades amb grans diferències depenent del centre de càlcul que contesti. Possiblement els resultats esmentats estan sobreestimats, ja que la recerca de frase no és exacta a l’igual de l'ús de múltiples operadors combinats. Unes altres prestacions avançades estan en llista d'espera atesa la quantitat de recursos informàtics que requereixen: classificació de resultats (clústers), cerca multilingüe o truncaments.

Els últims dos anys una de les millores poc conegudes de Google sí que ha tingut un impacte significatiu en la percepció de la qualitat dels resultats. S'ha incorporat un sistema de localització (semifiltre lingüístic), que és relativament simple, i que va lligat a l'elecció que l’usuari fa de l'idioma de la interfície. L'elecció esmentada condiciona els resultats presentats que són ara més "pròxims" geogràficament i idiomàticament. Tanmateix, és una opció que passa desapercebuda per a la gran majoria del públic i els professionals.

Google s'ha decantat aquests últims anys per diversificar l'oferta de serveis, oferint cercadors d'imatges i vídeo, acadèmics o geogràfics, i fent un gran esforç per integrar-los. Aquest fet pot tenir conseqüències a mitjà termini, ja que la interfície es complicarà notablement i la fusió de continguts pot generar més soroll. Tanmateix la idea d'incorporar imatges sembla funcionar bé a Exalead (abocaments) i és una de les bases de Cuil, un nou motor dissenyat per exmembres de Google.

És difícil predir el futur, però si Google desitja millorar la qualitat de les respostes, obligatòriament necessitarà recopilar molta més informació addicional. Un primer pas, com ja fa temps que recull Yahoo, és associar peticions amb enllaços visitats. No és segur que a més s'associï algun tipus de galeta o identificació per IP però aquest coneixement extra acaba perfilant l'usuari i millorant amb l'experiència. Però és evident que Google vol anar més enllà i té els mitjans necessaris per creuar informació personal de totes les fonts que ja controla. Això ha generat un fort debat sobre la privacitat i la protecció de les dades personals, però com el boom de les xarxes socials mostren, aquesta preocupació és minoritària.

Una alternativa a panorama tan ombrívol passa per l'assumpció d'algunes responsabilitats pels mitjancers humans (per exemple, documentalistes i bibliotecaris), potser oposant el web semàntic al web social, que guanya així la batalla de la intertextualitat. Però com bé sabem ni el web semàntic no ha tingut èxit encara, ni obligatòriament la ingent feina necessària per produir-la estarà a les nostres mans.