Come probabilmente sapete già, per i siti web c’è la possibilità di indicare ai motori di ricerca quali sezioni indicizzare e quali no, scrivendo le dovute istruzioni all’interno di un file che si chiama robots.txt. Anche Google ha ovviamente il suo, tra l’altro bello lungo come ci si aspetterebbe, affiancato però da un humans.txt che contiene quanto segue:
“Google is built by a large team of engineers, designers, researchers, robots, and others in many different sites across the globe. It is updated continuously, and built with more tools and technologies than we can shake a stick at. If you’d like to help us out, see google.com/jobs.”
Praticamente una specie di easter egg che rimanda alla pagina delle offerte di lavoro Google. Ma del resto, “giocare” con humans e robots non è una novità: anche YouTube ne sa qualcosa visto che proprio il suo robots.txt recita queste parole:
“Created in the distant future (the year 2000) after the robotic uprising of the mid 90’s which wiped out all humans.”
Conoscete qualche altro file robots degno di nota, che non contenga quindi solo ciò per cui è fatto?
Via | Google Operating System
favicon
09 mag 2011 - 15:38 - #1http://www.lyricsmode.com/lyrics/f/flight_of_the_conchords/the_humans_are_dead.html
Chi cita chi? :D
banana_republic
09 mag 2011 - 16:05 - #2http://www.reddit.com/robots.txt
http://www.yelp.com/robots.txt
http://www.last.fm/robots.txt
ho curiosato per la rete ed ho trovato questi :-)
Fabiooo
09 mag 2011 - 17:03 - #3#2 : ma il primo e il terzo sono standard, per quello ogni sito serio ne ha uno.
romfladef
09 mag 2011 - 19:35 - #4Non è proprio un’easter egg: HumansTXT è un progetto abbastanza “serio” per dare uno standard ai metadata su autore, compagnia e sito web. Non è autorevole come Dublin Core Metadata Initiatie (DCMI), né diffuso come Open Graph di Facebook e può sembrare un gioco. Tuttavia molti lo stanno adottando. Anch’io lo utilizzo.
virgafox
09 mag 2011 - 20:24 - #5@ Fabioo
dal primo:
User-Agent: bender
Disallow: /my_shiny_metal_ass
non mi sembra molto standard XD
banana_republic
09 mag 2011 - 23:24 - #6@3: non sono tanto standard :-)
“User-Agent: bender
Disallow: /my_shiny_metal_ass”
“Disallow: /harming/humans
Disallow: /ignoring/human/orders
Disallow: /harm/to/self”
tommmmmmmmmmmmmm
10 mag 2011 - 13:47 - #7http://www.nike.com/robots.txt JUST CRAWL IT :D
http://www.adidas.com/robots.txt GO AWAY