domenica 19 giugno 2011

Blocco Poste: quando il mainframe IBM va in tilt ...



Sarmi non fa più causa a IBM

Sembra che Massimo Sarmi, l'AD delle Poste, non voglia più fare causa a IBM per il blocco dei computers delle Poste della prima settimana di giugno. Stando alle ultime dichiarazioni  su L'Espresso, il blocco dei computers non sarebbe una cosa poi tanto grave. Cose che succedono ... E i battaglieri propositi di far causa a Big Blue, che ha fornito il computer mainframe del nuovo sistema informativo delle Poste, sembrano ormai dimenticati.

Nel frattempo, ogni tanto i computers di qualche ufficio postale vanno in tilt, ma non si vedono più le code chilometriche di inizio giugno.  Stando alle dichiarazioni dello stesso Sarmi, nella prima settimana di giugno c'è stata un'ecatombe: si è passati dagli abituali 8 milioni di pratiche giornaliere sbrigate dagli uffici postali di tutta Italia, ad appena 6 milioni. Questo vorrebbe dire, ipotizzando due pratiche (pensioni, bollettini, ecc.) per ogni utente, che nella prima settimana di giugno ogni giorno almeno un milione di utenti è stato "respinto" dalle Poste, quasi sempre dopo aver fatto lunghissime file. Stando ai numeri dettati da Sarmi, per i cinque giorni lavorativi della prima settimana di giugno si possono ipotizzare almeno 5 milioni di utenti insoddisfatti. Alcuni, probabilmente, proprio imbufaliti. Un record nazionale!


Il balletto per lo scarico delle responsabilità

Intanto, il balletto per lo scarico delle responsabilità del blocco delle Poste continua. I protagonisti sono:  l'IBM, che ha vinto, come capo commessa, la mega gara da 33 milioni di euro per il nuovo sistema informatico delle Poste; la HP, che ha fornito i servers per il database; e la Gepin, che ha prodotto il sofware SDP che gira sui 60mila PC delle Poste. IBM, HP e Gepin si sono consorziati per vincere la mega gara delle Poste, e non ci sono stati altri partecipanti. Praticamente, una gara vinta in regime di monopolio. Apparentemente, l'anello debole del nuovo sistema informativo delle Poste è l'architettura centralizzata fornita dall'IBM: al centro del nuovo sistema c'è un solo, costosissimo computer mainframe IBM con ben 200 CPU.




Nella nuova architettura informatica delle Poste, su ognuno dei 60 mila PC degli uffici postali gira il software SDP della Gepin, ma il mainframe IBM del datacenter di Roma controlla tutto: nessun terminale può far nulla se prima non si collega in rete con il mainframe romano. Dopo aver ricevuto la richiesta di effettuare un'operazione da un terminale di un ufficio postale, il mainframe IBM recupera i dati necessari (dati anagrafici, dati del conto, ecc.) dal database DB2 installato sui server HP e poi, se tutto va bene, esegue l'operazione. Sottolineiamo il "se tutto va bene". Gli intoppi possono essere tanti: il PC che va in tilt, la rete che va a singhiozzo, il mainframe IBM che non ce la fa, i server HP che litigano con il mainframe IBM. Ma è chiaro che il vero "collo di bottiglia" è il mainframe: unico, insostituibile. Tutto gira intorno al mainframe. Un pò come tutto girava intorno alla Terra nell'antico sistema cosmologico tolemaico.





E' paradossale pensare che i 60 mila computers delle Poste potrebbero comunicare direttamente tra loro, potrebbero comunicare su Internet con tutto il mondo (durante il blocco alcuni dipendenti delle Poste hanno anche comunicato su Facebook per cercare di capire cosa stava succedendo) ma non possono fare nulla di "postale" (pagamento pensioni, bollettini ecc.) se il computer centrale di Roma è bloccato. Internet (la "rete delle reti") è stata inventata, negli anni '60, proprio per prevenire questo tipo di problemi. E nel 2011, quando ormai tutti gli italiani hanno Internet a casa, si scopre che tutto il sistema informativo delle Poste dipende da un unico computer mainframe IBM!



Ipotesi sulle cause del blocco

Al di là delle considerazioni cosmologiche, secondo un articolo di L'Espresso la colpa del blocco dei computers sarebbe delle Poste, che avrebbero imposto a IBM, HP e Gepin di installare per il primo giugno una nuova versione del software di sportello SDP. Questo nuovo software non era stato collaudato a sufficienza, e così si è bloccato tutto. Per una settimana.

In realtà sembra sia andata in tilt una delle componenti più "antiche", e finora ritenute più affidabili, del software di sistema del mainframe IBM: il VTAM (Virtual Telecommunication Access Method). Il VTAM serve a far dialogare il mainframe IBM con i 60 mila terminali delle Poste e con i server HP Superdome del datacenter di Roma, dove sono memorizzati i dati del database DB2. Per risolvere il blocco, l'IBM ha addirittura coinvolto un centinaio di super esperti VTAM degli USA e del Canada. Al momento, non è ancora chiaro se il rallentamento del VTAM sia dovuto a limitazioni intrinseche o alla scelta, apparentemente infelice, di sovraccaricare il mainframe IBM obbligandolo a uno strettissimo colloquio con i server HP per gestire il database DB2. In teoria, visto che IBM e HP si sono consorziate quando hanno offerto alle Poste il nuovo sistema informativo, i loro computers dovevano andare d'amore e d'accordo. Ma qualcosa non ha funzionato.

Sui motivi del malfunzionamento del VTAM IBM c'è un'ipotesi "pierinesca" ma credibile: i computers IBM e HP comunicavano con uno standard di rete, il TCP/IP, che limita a 65 mila il numero di "porte" disponibili per il colloquio tra due computers. Se si superano le 65 mila "porte" TCP/IP, uno, o tutti e due, i computers che si stanno scambiano i dati vanno in tilt, o chiudono la comunicazione.
Nel caso delle Poste, sembra che sia stato il VTAM, il software che gestisce le comunicazioni del mainframe IBM, ad andare in tilt. Tenendo conto del gran numero di terminali delle Poste (60 mila) e del fatto che per ogni operazione il mainframe IBM potrebbe aver usato più di una "porta" TCP/IP per comunicare con i server HP, è possibile che il limite delle 65 mila "porte" TCP/IP sia stato superato. In questo caso, sia il mainframe IBM, sia i servers HP, avrebbero potuto andare in tilt, o interrompere le comunicazioni.
Il limite delle 65 mila "porte" TCP/IP può comunque essere aggirato in vari modi. Sempre a pensarci prima. Infatti si ipotizza che il blocco di un'intera settimana delle Poste sia dovuto  soprattutto alle modifiche software necessarie per "aggirare" il limite delle 65 mila porte TCP/IP.


Secondo l'ineffabile Dagospia (una fonte "di basso livello" e quindi intrinsecamente credibile) il problema del mainframe IBM delle Poste sarebbe stato il "running bag". Nei computers, i "running bag" sono, in parole semplici, liste di cose da fare (task list). Ad esempio, sui PC con Windows  la "gestione attività" ("task list") è un esempio di "running bag". Stando alla voce riportata da Dagospia, il mainframe IBM delle Poste si sarebbe "impallato" perchè il "running bag" VTAM si è riempito fino al limite, probabilmente a causa dello stress per i continui colloqui con i server HP che gestiscono il database DB2. Un pò come se un PC si "impallasse" quando uno gli collega l'hard disk esterno.

E' interessante osservare che l'IBM produce dei server simili ai Superdome HP attualmente usati dalle Poste, ma più costosi: gli IBM Power Systems. Ovviamente i servers IBM Power Systems comunicano a meraviglia con i mainframe IBM, visto che sono della stessa marca. Se le Poste avessero acquistato i servers IBM Power System, spendendo e preparandosi a spendere ovviamente di più, probabilmente il VTAM del mainframe IBM non si sarebbe bloccato, e il tilt della prima settimana di giugno non ci sarebbe stato. Il rovescio della medaglia è che le Poste si sarebbero trovate con un datacenter completamente "colonizzato" dall'IBM. Insomma, una sorta di "Banana Republic" dell'informatica (dopotutto, l'IBM è una multinazionale americana).
In ogni caso, sulla carta IBM sostiene a spada tratta che i suoi prodotti hardware e software sono pienamente compatibili con le marche concorrenti, come HP. Tant'è vero che il database DB2 installato sui server HP delle Poste, che pare abbia "stressato" il VTAM del mainframe IBM, è un software prodotto dall'IBM.

Se fossero confermate le voci sul "matrimonio forzato" tra il mainframe IBM e i server HP delle Poste, che a giugno ha provocato il blocco del mainframe, l'Italia si aggiudicherebbe il poco invidiabile primato mondiale di aver collaudato una nuova architettura informatica delicata e impegnativa (60 mila terminali, mainframe IBM, database DB2 su server HP) non nelle asettiche stanze di un laboratorio di sviluppo software, ma direttamente negli uffici postali, a spese dei milioni di italiani che hanno fatto la fila nella prima settimana di giugno. E tutto questo con il beneplacito di IBM e HP, che si sono consorziate nella mega-offerta da 33 milioni di euro per il nuovo sistema informativo postale. Garantendo implicitamente la piena compatibilità tra i loro sistemi.      


Le Poste e la crisi dell'architettura mainframe centrica




Credo che dal blocco delle Poste della prima settimana di giugno si possano trarre due lezioni:

  • l'architettura dei computer mainframe IBM è ormai al tramonto, perchè è poco affidabile (un solo mainframe per gestire migliaia di terminali) e non garantisce più abbastanza potenza di calcolo per i software attuali, sempre più affamati di CPU; per fare un esempio "terra terra", basti pensare che il mainframe IBM delle Poste che si è bloccato aveva 200 CPU per 60 mila terminali (una CPU ogni 300 terminali); il mio PC ha 4 CPU (che lavorano tutte per me); i cellulari più potenti hanno 2 CPU;

  • con il nuovo sistema informativo, le Poste sono andate "al risparmio", perchè l'architettura basata su un solo mainframe è molto più economica di un'architettura basata su diversi server locali (nel vecchio sistema informativo, le Poste avevano addirittura 14 mila server locali, uno per ogni ufficio); i disagi per le scelte, "risparmiose" ma per certi versi discutibili, delle Poste sono stati subiti dai poveri italiani in coda negli uffici postali: stando alle dichiarazioni dello stesso Sarmi, nella prima settimana di giugno le Poste avrebbero "saltato" addirittura due milioni di operazioni al giorno.

Su tutta la vicenda aleggia il quadro desolante dello sfruttamento che la Pubblica Amministrazione ottiene facendo gare di appalto al ribasso senza adeguate verifiche della qualità dei servizi; infatti, al di là delle cifre milionarie pagate per il mega appalto informatico delle Poste, sembra che il software di sportello SDP, realizzato dall'italiana Gepin, ed i servizi informatici di più basso livello nella gestione del sistema informativo siano stati spesso subappaltati a società che sfruttano lavoratori precari pagati poco più di una colf; insomma, quelli che il ministro Brunetta ha recentemente definito come "l'Italia peggiore".


    Gli ipotetici rimborsi delle Poste





    L'AD di Poste, Massimo Sarmi, ha promesso rimborsi per i clienti danneggiati.
    All'inizio, il CODACONS avrebbe chiesto addirittura 50 euro per ogni attesa superiore alle due ore. Esagerati! 
    Proviamo a fare un esercizio di semplice aritmetica, ipotizzando un rimborso medio di 10 euro per ognuna delle operazioni (due milioni al giorno, quindi dieci milioni in cinque giorni) "saltate" durante il tilt dei computers nella prima settimana di giugno. 10 euro a operazione sono un valore puramente indicativo, una media ipotetica tra i danni al pensionato che è rimasto in fila una giornata intera per avere i suoi 500 euro di pensione che gli servivano per sopravvivere (e credo abbia diritto ad almeno 100 euro) e il ragazzotto "smart" che, quando ha visto l'interminabile fila fuori dall'ufficio postale, è andato subito a pagare il suo bollettino dal tabaccaio (cioè non gli è cambiato niente).

    Applicando questo semplice esercizio aritmetico, con 10 euro di rimborso per ogni operazione saltata si arriverebbe a un totale di 100 milioni di euro di rimborso. Soldi che le Poste, o l'IBM (questo è ancora da capire) dovrebbero in teoria restituire agli italiani rimasti in coda davanti agli sportelli bloccati. Mica male! Se avessero ipotizzato il rischio di dover rimborsare 100 milioni di euro per danni, forse le Poste avrebbero realizzato un sistema informativo più costoso ma decentrato, veloce e (soprattutto) funzionante!
    O forse no? Dopotutto, la mega gara d'appalto delle Poste per la realizzazione del nuovo sistema informativo ha avuto un'unica offerta, quella dell'IBM. A voler essere cattivi, si potrebbe pensare che con 100 milioni di euro in più le Poste avrebbero ottenuto esattamente lo stesso sistema attuale. Ma pagandolo 100  milioni di euro in più.
    Ormai è troppo tardi per verificare queste ipotesi, e gli ipotetici 100 milioni di euro sono comunque andati in fumo. Temo che dovremo sorbirci ancora lunghe, lunghe code alle Poste. E temo che pochi dei poveretti rimasti in coda alle Poste vedranno mai una lira di rimborso. Sono pessimista?

    Nessun commento:

    Posta un commento