Moda, Media e Mediana sono indici di posizione che ci indicano la forma della distribuzione con la loro posizione reciproca.

Se media e mediana coincidono abbiamo una distribuzione simmetrica.
Una distribuzione è simmetrica quando il numero di unità inferiori alla MEDIA è uguale al numero di unità superiore alla media.
Una distribuzione è asimmetrica a destra se il numero di osservazioni inferiori alla media è maggiore del numero di osservazioni superiori alla media
Una distribuzione è asimmetrica a sinistra se il numero di osservazioni inferiori alla media è minore del numero di osservazioni superiori alla media.
Tanto più sono diverse moda mediana e media, maggiore è l’asimmetria della distribuzione.
Per le distribuzioni asimmetriche bisogna sempre affiancare il valore della mediana a quello della media perchè la media risente molto dei valori eccessivamente grandi o piccoli (dati anomali).
INDICI DI DISPERSIONE
Un indice di posizione senza l’ indicazione della sua variabilità non da una visione completa del dato, perciò per valutare una distribuzione dobbiamo sapere come si “disperdono” i dati intorno all’indice di posizione. Ossia calcolare la variabilità dei nostri dati.
Per fare questo utilizziamo alcuni indici di dispersione:
- Intervallo di variabilità (intervallo di variazione o range)
Differenza tra il più grande e il più piccolo valore osservato.
Iv=Xmax-Xmin
- Differenza interquartile
Differenza tra terzo e primo quartile.
Iq=Q3-Q1
- Devianza
Scarto dato dal rapporto tra ogni singola grandezza del campione e la media del campione stesso.

- Varianza
Misura di variabilità che è media delle deviazioni dalla media al quadrato.



- Scarto quadratico medio (deviazione standard)
E' un indice della dispersione dei dati rispetto alla loro media.


- Coefficiente di variazione
Rapporto tra scarto quadratico medio e media aritmetica


Valori medi e deviazioni standard di glicemia e calcemia su un gruppo di soggetti :
Calcemia
Media: 9 mg/100ml
Deviazione standard: 1,5mg/100ml
Glicemia
Media: 85mg/100ml
Deviazione standard: 11mg/100ml

CALCOLARE DEVIAZIONE STANDARD
Supponiamo di aver ricavato N misure della stessa grandezza x. Con queste abbiamo poi calcolato la media. La media sembra indicare qual è, grosso modo, il valore che possiamo aspettarci scegliendo un dato a caso; in probabilità, si chiama valore atteso. Questo non è necessariamente vero in quanto, calcolata la media, i valori dei dati possono essere molto lontani da questa. Per dare una valutazione dell'incertezza da associare a tale stima, iniziamo col considerare una prima quantità chiamata scarto o deviazione.
Per dare una valutazione dell'incertezza da associare a tale stima, iniziamo col considerare la
DEVIANZA.

Poiché gli scarti costituiscano un buon punto di partenza per lo studio dell'incertezza da associare alla media, per ovviare all'inconveniente legato alla loro somma, eleviamo al quadrato le singole deviazioni ottenendo tutte quantità positive e quindi in grado di essere sommate tra loro.
Con la somma degli scarti al quadrato (DEVIANZA), divisa per il numero di rilevazioni, è possibile produce la media degli scarti, corrispondente alla VARIANZA (quadrato della DEVIAZIONE STANDARD)


esempio:
pazienti ricoverati nel giorno 1: 16
pazienti ricoverati nel giorno 2: 34
pazienti ricoverati nel giorno 3: 10
pazienti ricoverati nel giorno 4: 20
pazienti ricoverati nel giorno 5: 20
pazienti ricoverati nel giorno 6: 20
pazienti ricoverati nel giorno 7: 15
pazienti ricoverati nel giorno 8: 25
pazienti ricoverati nel giorno 9: 20
media: (16+34+10+20+20+20+15+25+20)/9=180/9=20
Applicando la formula della devianza
pazienti neo-ricoverati nel giorno 1: quadrato di (16-20)=16
pazienti neo-ricoverati nel giorno 2: quadrato di (34-20)=256
pazienti neo-ricoverati nel giorno 3: quadrato di (10-20)=100
pazienti neo-ricoverati nel giorno 4: quadrato di (20-20)=0
pazienti neo-ricoverati nel giorno 5: quadrato di (20-20)=0
pazienti ricoverati nel giorno 6: quadrato di (20-20)=0
pazienti ricoverati nel giorno 7: quadrato di (15-20)=25
pazienti ricoverati nel giorno 8: quadrato di (25-20)=25
pazienti ricoverati nel giorno 9: quadrato di (20-20)=0
Applicando la formula della varianza per piccoli studi (divisione della Devianza per N-1)
Totale Devianze=16+256+100+0+0+0+25+25+0=422
Varianza=422/(9-1)=52,75
Applicando la formula della deviazione standard
Deviazione standard=Radice quadrata di 52,75=7,26291952 (arrotonderemo a 7,3 per semplificare)
Questo significa che le misure deve rientrare nell'intervallo (20-7,3) e (20+7,3), cioè tra 12,7 e 27,3 (COEFFICIENTE DI VARIAZIONE = (7,3/20)*100=36,5%).
Le misure che cadono in questo intervallo sono: 16; 20; 20; 20; 15; 25; 20; cioé 7 su 9.
CALCOLO DELLA VARIANZA PER DISTRIBUZIONE DI FREQUENZA


Varianza: va=[((x-m)^2)*n)]/n=1026,28/370=2,77
Deviazione standard: ds=Rad 2,77=1,66
CALCOLO DELLA VARIANZA PER DISTRIBUZIONE DI CLASSI
esempio

In questo esempio abbiamo in media una degenza di 9,2 giorni e le unità si discostano da questo valore in media di 4,7 giorni in più o in meno.
Così, piu' è alta la deviazione standard, tanto meno è informativa la media, perchè i dati si allontanano molto da essa.
Se la Deviazione standard è uguale a zero significa che i miei dati non si discostano dalla media e quindi sono uguali.
2 commenti:
VARIANZA (ottenibile anche dalla radice quadra della DEVIAZIONE STANDARD).
e' l'incontrario!!! la varianza la ottieni elevando al quadrato la deviazione standard
ciao
Valentina
Questo significa che le misure deve rientrare nell'intervallo (20-7,3) e (20+7,3), cioè tra 12,7 e 27,3
Le misure che cadono in questo intervallo sono: 16; 20; 20; 20; 15; 25; 20; cioé 7 su 9.
?????????
Forse c'è un po' di confusione con l' intervallo di confidenza e con il range che contiene il 95% delle misurazioni se la distribuzione è normale
Ciao
Valentina
Posta un commento