Google indicizza anche i documenti scansionati

Google indicizza anche files scansionatiSecondo quanto riportato dal GoogleBlog, il motore di ricerca da oggi inizierà ad indicizzare e quindi ad includere nei risultati proposti, anche il testo proveniente da files derivati da scansioni.

Per offrire questo nuovo servizio Google si avvarrà dell'OCR (Optical Character Recognition, che permette di estrarre da una immagine del testo), che non sempre è affidabile, come spiegato anche nel post di presentazione, perchè un computer distingue difficilmente la lettera O dalla cifra 0 oppure semplicemente da un piccolo cerchio.

Per avere una prova della nuova funzione si può cercare repairing aluminium wiring ed apprezzare l'ottimo lavoro dal primo risultato (un pdf proveniente dal dominio cpsc.gov).

Via | TechCrunch.com

  • shares
  • Mail