L'indice di Google comprende 1 trilione di URL

L'indice di Google comprende 1 trilione di URLLo ha ammesso Google stessa: l'unico modo per andare avanti è pensare sempre in grande. E la società che più di tutte ha rivoluzionato il web negli ultimi anni non ha mancato la parola. Perchè Google ha dichiarato che il suo indice contiene 1 trilione di URL univoci, ovvero senza duplicati.

Era ancora il 1998 quando l'indice delle pagine di Google comprendeva "solo" 26 milioni di pagine, raggiungendo la soglia del miliardo nel 2000. Ma da allora, con l'avvento del Web 2.0 le cose sono andate crescendo sempre di più, così come la presenza di Google.

Oggi Google analizza il Web di continuo e ricalcola il numero di pagine più volte al giorno. Come fa Google a compiere queste ricerche. Come una mappa che si ingrandisce, Google parte da una singola pagina, per scannerizzare via via i link relativi e allontanarsi dal punto di partenza.

E quanti sono gli URL non univoci, cioè contenenti duplicati? Teoricamente infiniti! Prendete in considerazione i calendari Web: si può scorrere l'elenco dei mesi e degli anni, generando praticamente un numero molto grande di pagine.

Via | News.cnet.com

  • shares
  • Mail
4 commenti Aggiorna
Ordina: