Ho la fortuna di conoscere Massimo Marchiori inventore dell’algoritmo di Google.
Dopo avergli chiesto il consenso, riporto qui l’estratto di una sua intervista pubblicata su Focus lo scorso mese.



Immaginate un bibliotecario che non sa una parola d’italiano. Che riesce sono a riconoscere due parole identiche in una pagina, senza capirne il significato. E si limita a guardare una stanza su quattro della biblioteca, senza scendere negli enormi scantinati… Gli affidereste la ricerca di un libro che vi interessa? Probabilmente no. Eppure, è quello che fate quando digitate una ricerca su Google e sugli altri motori di ricerca.

Come funzionavano i motori di ricerca prima di Google?
Cercavano in ogni pagina web la parola inserita nella ricerca e premiavano le ricorrenze: se una pagina citava più volte quella parola, finiva in cima alla lista dei risultati.

Che cosa hai fatto?
Se voglio capire una persona puntando il binocolo sul viso, ottengo informazioni parziali: ma se allargando il campo, vedo che stringe la mano ad un mafioso, ottengo un’informazione più significativa… Sono le relazioni con le altre pagine web, i link, a far capire se una pagina è utile. Ho elaborato un modello matematico che dava punteggi decrescenti (da 1 a 10) a ogni sito linkato e che migliorava i risultati delle ricerche del 60%. Lowrence Page (uno dei due fondatori di Google) lo vide ad una conferenza a Santa Clara nel 1997 e nel 1998 lo lanciò con una correzione: mentre il mio algoritmo premia le pagine più utili (più ricche di link) quello di Google (pagerank) premia i siti più popolari.

Da allora cos’è cambiato?
Google ha rivoluzionato il web: per avere più visibilità, i siti hanno aggiunto molti link, anche in automatico, impoverendo il valore dei link. I motori di oggi sono come la TV generalista: non scontenta nessuno ma non approfondisce nulla.

Quali sono i limiti di Google?
Secondo le mie stime Google fa ricerche al massimo sul 25% delle pagine. Deve operare una scelta per non allungare i tempi di risposta e per motivi tecnici: non esiste un computer capace di fare in tempo accettabile una ricerca sull’intero web.

Google come decide dove cercare?
Nessuno lo sa: è un segreto industriale. Se fosse imparziale e automatico sarebbe accettabile. Ma c’è un intervento umano: per esempio tutte le voci di Wikipedia sono considerate di serie A e finiscono nella top list. Inoltre Google possiede Doubleclick, la più grande concessionaria pubblicitaria di Internet: chi ci assicura che non premi i propri clienti? Il fatto che Google (ma anche gli altri) non sveli i propri criteri, è come le elezioni senza controllori allo spoglio delle schede.

Come rimediare?
Ci vorrebbe un motore trasparente, open source, che sveli i criteri adottati, anche se le controindicazioni sarebbero legate all’approfittarsi di qualcuno nel costruire reti che si adattino ad esso, ottenendo così corsie preferenziali…

E i problemi di privacy?
I motori di ricerca hanno un database mostruoso di informazioni: che uso ne fanno? La polizia dovrebbe fare controlli ciclici, per evitare abusi.
Un potere che potrebbe anche aumentare: nel 2008 Google ha chiesto alle società di telecomunicazioni di avere corsie preferenziali per i propri dati: se ciò avvenisse le pagine di Google si caricherebbero subito a scapito di quelle degli altri con la conseguente fine della democrazia del web.

Quale sarà il futuro dei motori di ricerca?
Il web semantico. Entro il 2020 i motori saranno capaci di capire il senso di frasi complesse (oggi in qualche caso sono in grado di capire i sinonimi), come: “dov’è il ristorante più vicino dove il vino non costa troppo?.”
L’ideale sarebbe riprodurre nei computer le associazioni del cervello ma la mole di dati sarebbe spaventosa.

Come immagini il web del futuro?
Tra 20 o 50 anni (non è dato saperlo), sarà un motore di ricerca stile Star Trek che esegue gli ordini vocali. Capace di adattarsi alle nostre capacità di linguaggio, senza costringerci a imparare le istruzioni. Con interfacce 3D per manipolare le immagini. Il GPS ci seguirà ovunque. L’informazione e la persona saranno la stessa cosa: potremmo chiedere se nei paraggi c’è qualcuno che vuole fare due chiacchiere. Il web non sarà solo una grande biblioteca, ma una piazza di incontri: i social network lo stanno già dimostrando.