mercoledì 8 maggio 2019

Le due Italie





SWD Challenge maggio - Come controllare le mie camminate

A causa di un problema di salute, da alcuni mesi l'unica attività fisica che posso fare è camminare. Per rendere un po' più interessante queste camminate uso un cardiofrequenzimetro e questi sono i dati che registrati da settembre a novembre 2018.

Questa è una dashboard disponibile all'indirizzo https://public.tableau.com/profile/gianni.dugheri#!/vizhome/SWDchallengemay/Dashboard1
Posso selezionare una data e vedere quanto ho camminato quel giorno, quanto tempo e la lunghezza del mio passo. Questa è la mia proposta per la #SWDchallenge di @storywithdata del mese di maggio

martedì 30 aprile 2019

Le elezioni politiche in Spagna



Domenica 28 si sono svolte in Spagna le elezioni per il rinnovo del parlamento a distanza di soli tre anni dalle ultime. Le elezioni sono uno dei fenomeni quantitativi che più stimolano le più fantasiose rappresentazioni grafiche: è tutto un rifiorire di colori, forme e angoli strani per descrivere un risultato neanche tra i più complessi. In fondo bastano due grafici per raccontare come è andata
1 – il voto popolare


Il voto popolare ha visto il Partito Socialista arrivare primo e con grande distacco nei confronti del Partito Popolare e Ciudadanos.
2- la ripartizione dei seggi in parlamento e le variazioni tra il 2016 e il 2019




Come in tutte le elezioni, il voto popolare si deve trasformare in seggi del parlamento che rappresentano la vera forza dei partiti. Il sistema elettorale spagnolo è proporzionale quasi puro con soglia di sbarramento, questo comporta che la ripartizione dei seggi in parlamento rispetta quasi fedelmente il risultato del voto popolare. Il confronto tra la ripartizione del 2019 con quella del 2016 danno la dimensione di come sono mutati i rapporti di forza in parlamento: appare così evidente la vittoria del Partito Socialista e l’avanzata di Ciudados; in forte calo sia il Partito Popolare che praticamente dimezza la propria rappresentanza parlamentare sia Podemos. Infine, si segnala l’entrata in parlamento del partito di estrema destra Vox.
Questi i dati più significativi in due grafici, da qui possono partire le considerazioni

venerdì 26 aprile 2019

SWD Challenge aprile

Ad aprile sono arrivato tardi ma alla fine ho voluto farlo lo stesso. Sarò pronto a maggio a rispettare i tempi del challenge.
La sfida di aprile era quella di emulare (http://www.storytellingwithdata.com/blog/2019/4/1/swdchallenge-emulate) un modello cercando di reinterpretare una visualizzazione. 
Quando si imparano le migliore tecniche di visualizzazione dei dati, l'emulazione è una buona cosa, anche perchè c'è un'enorme differenza tra plagio ed emulazione: si parla di plagio quando si sta cercando di far passare il lavoro di qualcun altro come se fosse il tuo. La copia riguarda il reverse engineering. È come un meccanico che smonta una macchina per vedere come funziona. 
Questo concetto per la verità vale praticamente in ogni campo e non solo per la visualizzazione dei dati.
La mia emulazione riguarda l'Istat (ci mancherebbe altro) nel lavoro Noi Italia (ottimo davvero! http://noi-italia.istat.it/), la cui consultazione è da consigliare a chiunque voglia conoscere qualche numero e fare qualche confronto sia tra le regioni sia tra l'Italia e gli altri paesi europei.
Io ho preso a riferimento la sezione istruzione (http://bit.ly/2UIzhbJ) e questa è la mia interpretazione (https://tabsoft.co/2UWNiaB) dove ho limitato il campo di osservazione alla sola Toscana confrontando con il Centro Italia e l'Italia

SWD Challenge marzo

Ho partecipato alla mia prima SWD Challenge nello scorso mese di marzo organizzata da Cole Knaflic (su Twitter @storytwithdata). Una sfida stimolante per rappresentare dei dati e raccontare al meglio la storia che gli stessi dati rappresentano. In questo caso il dataset di riferimento si riferiva alle donazioni date e fornite ai vari paesi da altri paesi e/o enti vari (UE per esempio) dagli anni 40 a oggi.
Questa è la mia realizzazione https://public.tableau.com/profile/gianni.dugheri#!/vizhome/SWDchallengemarch/SWDchallengemarch e qui quelle degli altri partecipanti circa una settantina da tutto il mondo http://www.storytellingwithdata.com/blog/2019/3/25/how-you-visualized-this

lunedì 11 marzo 2019

Una biografia in un grafico

Non ho idea di cosa vuole dire avere 50 anni, forse quando ne avrò 60 lo capirò meglio. Sono tanti anni ma a questo non ci penso perchè ho tante cose da fare, traguardi da raggiungere, insomma tanta voglia di vivere e tante persone da ringraziare. Ho provato a riassumere in un grafico la mia cronologia di ringraziamenti:



e ora la legenda:
  • Mamma (1969-2012), Babbo (1969-2013), Sonia (1969-1983) mi mancate
  • Sandra, Nicla e Marco (1969-oggi) grazie di essere la mia famiglia di origine
  • Cristina (2007-oggi) grazie di essere la mia compagna da 11 anni con il rammarico di non averti incontrata prima
  • Andrea e Filippo (2011-oggi) grazie di avermi scelto come babbo
e infine il giusto riconoscimento a Cole Nussbaumer Knaflic (su twitter come @storywithdata) da cui ho copiato l'idea di questo grafico

giovedì 14 febbraio 2019

Achtung indicatori!

Ogni volta che ci si vuole ricavare informazioni da con una moltitudine di dati quantitativi, si rende necessario operare una sintesi tramite indicatori statistici. Sono numerosi però gli esempi di indicatori usati male il più delle volte per scarsa conoscenza della materia.
Un esempio è il tasso di mortalità, definito come il numero medio di decessi in una certa popolazione (generalmente considerata a metà anno) per mille.
Dal sito www.indexmundi.com è possibile visualizzare la classifica di tutti i paesi del mondo del tasso di mortalità in ordine decrescente. L'Italia è al 32 posto con 10,4 morti ogni mille abitanti, stesso valore per la Sierra Leone. Potrebbe sembrare un pessimo risultato perchè ci sono circa 190 paesi nel mondo che hanno un tasso inferiore a quello dell'Italia.
Se però cambiamo indicatore e consideriamo la speranza di vita alla nascita l'Italia è 14 esima in ordine decrescente con 82,3 anni e la Sierra Leone è al 208 esimo posto con una speranza di vita di 58,6 anni.
L'apparente contraddizione deriva dal fatto che il tasso di mortalità è fortemente condizionato dalla struttura per età della popolazione e quella dell'Italia si distingue per essere particolarmente anziana  a differenza della Sierra Leone. La speranza di vita risulta essere un indicatore più adatto ai confronti territoriali sia per la sua costruzione sia per la sua interpretazione. Questo viene insegnato nelle prime lezioni dei corsi universitari di statistica e demografica eppure qui https://www.italiaoggi.it/qualita-vita e qui http://lab24.ilsole24ore.com/qdv2018/ lo usano per confrontare le provincie italiane, mah....

venerdì 8 febbraio 2019

Quando i grafici parlano da soli

Ieri l'Istat ha diffuso i primi dati demografici riferiti all'anno 2018 che confermano le tendenze ormai in atto da alcuni anni, cioè che il rallentamento delle immigrazioni è tale da non compensare più il saldo naturale (nati - morti). Ponendo l'attenzione sulle nascite, è ormai un fatto risaputo come in Italia siano in calo da anni e numerosi ricercatori e commentatori più o meno qualificati si sono esercitati nell'individuare le cause e i rimedi.
Il grafico sotto riportato rappresenta la serie storica dei nati vivi in Italia dal 2001 al 2018 in migliaia e come spesso capita, i dati anche senza particolari elaborazioni raccontano una storia così chiara che meno attributi si aggiungono migliore è il servizio che si da all'informazione che si vuole fornire.

Nati vivi in Italia dal 2001 al 2018. Dati in migliaia
Fonte: anni 2001 - 2017 Istat : dati.istat.it - 2018 Istat comunicato stampa del 7 febbraio 2019


L'andamento della serie è chiaro: dal 2001 al 2008 c'è un leggero ma costante incremento delle nascite; questo incremento si interrompe nel 2008 dove si registra un inversione di tendenza con calo costante e rilevante. Nel 2018 si registra il minimo della serie con 449 mila nati, 121 mila in meno rispetto al 2008.
In questo caso i dati parlano da soli: basta aggiungere il riferimento temporale e il valore di  ogni singolo anno e non è necessario aggiungere altro.

martedì 5 febbraio 2019

Costruire un grafico onesto

Costruire un grafico onesto Fare un grafico è sempre più facile grazie alla diffusione dei fogli elettronici, Excel su tutti. Fare un grafico che sia capace di descrivere l’informazione che vogliamo rappresentare senza distorcerla può essere però un po’ meno immediato. Faccio un esempio: i grafici 1 e 2 si basano sugli stessi dati, che sono il mio peso medio mensile da gennaio 2018 a gennaio 2019. Il grafico 1 a me sta più simpatico perché evidenzia il calo di peso degli ultimi mesi ma ha il difetto che inganna l’occhio rispetto al grafico 2 che è più onesto perché l’origine dei dati è a 0. Tra il massimo (aprile 2018 con 98,0) e il minimo (dicembre 2018 con 90,0) c’è una differenza di 8kg in valore assoluto e 8,2%. I due grafici però raccontano due variazioni percentuale molto diverse perché nel primo, con l’origine dei dati che parte da 86,0, la differenza percentuale tra il massimo e il minimo è pari a 66,7%. Inoltre il tipo di grafico scelto (a area) è sbagliato perché i dati sono discreti e non continui. Il fatto che il grafico 1 riproduca quello della app del mio cardiofrequenzimetro non qualifica che questa sia una scelta giusta.
Il grafico 2, invece, è un istogramma, come è giusto che sia.
A proposito @GarminItaly forse hai bisogno di una consulenza per i grafici? Io sono qui!

Grafico 1 – Peso medio mensile da gennaio 2018 a gennaio 2019

















Grafico 2 – Peso medio mensile da gennaio 2018 a gennaio 2019