giovedì 14 febbraio 2019

Achtung indicatori!

Ogni volta che ci si vuole ricavare informazioni da con una moltitudine di dati quantitativi, si rende necessario operare una sintesi tramite indicatori statistici. Sono numerosi però gli esempi di indicatori usati male il più delle volte per scarsa conoscenza della materia.
Un esempio è il tasso di mortalità, definito come il numero medio di decessi in una certa popolazione (generalmente considerata a metà anno) per mille.
Dal sito www.indexmundi.com è possibile visualizzare la classifica di tutti i paesi del mondo del tasso di mortalità in ordine decrescente. L'Italia è al 32 posto con 10,4 morti ogni mille abitanti, stesso valore per la Sierra Leone. Potrebbe sembrare un pessimo risultato perchè ci sono circa 190 paesi nel mondo che hanno un tasso inferiore a quello dell'Italia.
Se però cambiamo indicatore e consideriamo la speranza di vita alla nascita l'Italia è 14 esima in ordine decrescente con 82,3 anni e la Sierra Leone è al 208 esimo posto con una speranza di vita di 58,6 anni.
L'apparente contraddizione deriva dal fatto che il tasso di mortalità è fortemente condizionato dalla struttura per età della popolazione e quella dell'Italia si distingue per essere particolarmente anziana  a differenza della Sierra Leone. La speranza di vita risulta essere un indicatore più adatto ai confronti territoriali sia per la sua costruzione sia per la sua interpretazione. Questo viene insegnato nelle prime lezioni dei corsi universitari di statistica e demografica eppure qui https://www.italiaoggi.it/qualita-vita e qui http://lab24.ilsole24ore.com/qdv2018/ lo usano per confrontare le provincie italiane, mah....

venerdì 8 febbraio 2019

Quando i grafici parlano da soli

Ieri l'Istat ha diffuso i primi dati demografici riferiti all'anno 2018 che confermano le tendenze ormai in atto da alcuni anni, cioè che il rallentamento delle immigrazioni è tale da non compensare più il saldo naturale (nati - morti). Ponendo l'attenzione sulle nascite, è ormai un fatto risaputo come in Italia siano in calo da anni e numerosi ricercatori e commentatori più o meno qualificati si sono esercitati nell'individuare le cause e i rimedi.
Il grafico sotto riportato rappresenta la serie storica dei nati vivi in Italia dal 2001 al 2018 in migliaia e come spesso capita, i dati anche senza particolari elaborazioni raccontano una storia così chiara che meno attributi si aggiungono migliore è il servizio che si da all'informazione che si vuole fornire.

Nati vivi in Italia dal 2001 al 2018. Dati in migliaia
Fonte: anni 2001 - 2017 Istat : dati.istat.it - 2018 Istat comunicato stampa del 7 febbraio 2019


L'andamento della serie è chiaro: dal 2001 al 2008 c'è un leggero ma costante incremento delle nascite; questo incremento si interrompe nel 2008 dove si registra un inversione di tendenza con calo costante e rilevante. Nel 2018 si registra il minimo della serie con 449 mila nati, 121 mila in meno rispetto al 2008.
In questo caso i dati parlano da soli: basta aggiungere il riferimento temporale e il valore di  ogni singolo anno e non è necessario aggiungere altro.

martedì 5 febbraio 2019

Costruire un grafico onesto

Costruire un grafico onesto Fare un grafico è sempre più facile grazie alla diffusione dei fogli elettronici, Excel su tutti. Fare un grafico che sia capace di descrivere l’informazione che vogliamo rappresentare senza distorcerla può essere però un po’ meno immediato. Faccio un esempio: i grafici 1 e 2 si basano sugli stessi dati, che sono il mio peso medio mensile da gennaio 2018 a gennaio 2019. Il grafico 1 a me sta più simpatico perché evidenzia il calo di peso degli ultimi mesi ma ha il difetto che inganna l’occhio rispetto al grafico 2 che è più onesto perché l’origine dei dati è a 0. Tra il massimo (aprile 2018 con 98,0) e il minimo (dicembre 2018 con 90,0) c’è una differenza di 8kg in valore assoluto e 8,2%. I due grafici però raccontano due variazioni percentuale molto diverse perché nel primo, con l’origine dei dati che parte da 86,0, la differenza percentuale tra il massimo e il minimo è pari a 66,7%. Inoltre il tipo di grafico scelto (a area) è sbagliato perché i dati sono discreti e non continui. Il fatto che il grafico 1 riproduca quello della app del mio cardiofrequenzimetro non qualifica che questa sia una scelta giusta.
Il grafico 2, invece, è un istogramma, come è giusto che sia.
A proposito @GarminItaly forse hai bisogno di una consulenza per i grafici? Io sono qui!

Grafico 1 – Peso medio mensile da gennaio 2018 a gennaio 2019

















Grafico 2 – Peso medio mensile da gennaio 2018 a gennaio 2019