Nelle scorse ore Facebook è stato irraggiungibile per circa due ore e mezza. Si tratta della più lunga interruzione del servizio degli ultimi quattro anni. Al di là delle reazioni “liberatorie” che sappiamo alcuni di voi avranno, è davvero singolare il modo con il quale la questione è stata risolta.
Il tutto è raccontato in una nota di Robert Johnson (Facebook Director of Software Engineering dal 2006 ad oggi) su Facebook. Vediamo per sommi capi cos’è accaduto, grazie anche alla spiegazione del Guardian. Per gestire la mole di dati Facebook ovviamente non concentra i propri server in un unico luogo. I datacenter sono diversi e sparsi per il mondo. La gestione non è semplice, ma cerchiamo di riassumere il funzionamento semplificandolo il più possibile. Esiste un sistema di cache che viene aggiornato periodicamente, in modo che i vari server possano replicare il contenuto. Questa rete di server, che l’utente non nota durante la propria navigazione, è chiamata “The Facebook Network” aka tfbnw.net. E’ però visibile quando si effettua un traceroute su Facebook.com. Come in ogni struttura complessa gli errori possono sempre avvenire: generalmente vengono corretti in automatico dal sistema stesso. Questa volta non è andata così, una modifica al database ha provocato un errore che a sua volta ha generato un sovraccarico da tfbnw.net verso il database stesso.
Quale poteva essere la soluzione? Lo scrive direttamente Robert Johnson: “The way to stop the feedback cycle was quite painful – we had to stop all traffic to this database cluster, which meant turning off the site. Once the databases had recovered and the root cause had been fixed, we slowly allowed more people back onto the site.” Ebbene si: per fermare il circolo vizioso i tecnici hanno dovuto fermare il traffico verso il database e quindi spegnere la macchina. Ne più ne meno di quanto il vostro servizio tecnico vi chiede “hai provato a spegnere e riaccendere il pc?”. Un sistema antico, brutale, ma che a quanto pare funziona ancora nell’era del web 2.0 e del cloud computing.
Nel video, che dedichiamo sia a chi lavora nei vari uffici IT/Help Desk sia agli appassionati di telefilm esteri, una spassosa scena tratta da IT Crowd: “Have you tried turning it off and on again?”
TKSan
24 set 2010 - 14:22 - #1 (nascondi)Il paragone sinceramente non c’entra proprio niente…
la vera storia del """Google""" Lunar X Prize ...
24 set 2010 - 15:32 - #2 (nascondi)non per criticare, ma, veramente, il fattaccio è successo quasi 24 ore fa… postare una news con tale ritardo sarebbe troppo anche per un quotidiano stampato
gamepad
24 set 2010 - 15:35 - #3Vincere al Superenalotto solo per comprare Facebook e chiuderlo.
Peccato che €145.400.000 ti aiutano ben poco :D
la vera storia del """Google""" Lunar X Prize ...
24 set 2010 - 15:39 - #4 (nascondi)e così tutti gli utenti del Web finalmente si accorgono di una cosa che specialisti, hackers e terroristi informatici sanno già da tempo, ovvero, di quanto sia fragile la Rete… altro che “sistema in grado di funzionare anche dopo un attacco atomico” come ce l’hanno spacciato per anni, perché, per spegnere un sito mondiale da 500 milioni di utenti non ci vuol nulla… basta sapere dov’è l’interruttore generale e ruotarlo su OFF… :|
Glugluglu
24 set 2010 - 16:31 - #5ma ogni tanto leggere prima di commentare, no? si parla di come hanno risolto la questione, non che FB è giù. e ovviamente le spiegazioni non le hanno date ieri, le hanno date oggi… in più… cosa c’entra la rete: hanno spento una macchina, internet è rimasta attiva, non è crollato il mondo, è andato giù FB….
marco5
25 set 2010 - 07:51 - #6Mi chiedo quale possano essere le migliaia di euro (?) perse per un down di colossi del genere. Come quando il mondo perse milioni di euro quando google mise pacman in home ehehe.
_alias
26 set 2010 - 18:44 - #7@marco5 bella domanda
shadow-warrior
27 set 2010 - 09:39 - #8la filosofia del “riavvia” o del ctrl-alt-del , applicata a livello mondiale :-D
xml
27 set 2010 - 12:54 - #9Tutte le infrastrutture informatiche hanno problemi del genere, solo che qui si tratta di facebook, il che avra’ mandato molta gente in paranoia…
… credo occorra riflettere un po’ su questa cosa …
Steffina
03 ott 2010 - 00:24 - #10Ma scusatemi..vogliamo parlare che su Facebook non funziona più nulla?..prendete le richieste d’amicizia..non me le fa più fareee!!..Perchè? Ho cercat un po’ online..e l’unico sito che mi smebra essere esplicativo è questo:
http://www.pausacaffe.net/facebook-problemi-nel-richiedere-amicizie-ecco-il-perche
…voi mi sapete dire qualcosa di più in merito?
Grazie, Stefania.