Moda, Media e Mediana sono indici di posizione che ci indicano la forma della distribuzione con la loro posizione reciproca.
Se media e mediana coincidono abbiamo una distribuzione simmetrica.
Una distribuzione è simmetrica quando il numero di unità inferiori alla MEDIA è uguale al numero di unità superiore alla media.
Una distribuzione è asimmetrica a destra se il numero di osservazioni inferiori alla media è maggiore del numero di osservazioni superiori alla media
Una distribuzione è asimmetrica a sinistra se il numero di osservazioni inferiori alla media è minore del numero di osservazioni superiori alla media.
Tanto più sono diverse moda mediana e media, maggiore è l’asimmetria della distribuzione.
Per le distribuzioni asimmetriche bisogna sempre affiancare il valore della mediana a quello della media perchè la media risente molto dei valori eccessivamente grandi o piccoli (dati anomali).
INDICI DI DISPERSIONE
Un indice di posizione senza l’ indicazione della sua variabilità non da una visione completa del dato, perciò per valutare una distribuzione dobbiamo sapere come si “disperdono” i dati intorno all’indice di posizione. Ossia calcolare la variabilità dei nostri dati.
Per fare questo utilizziamo alcuni indici di dispersione:
- Intervallo di variabilità (intervallo di variazione o range)
Differenza tra il più grande e il più piccolo valore osservato.
Iv=Xmax-Xmin
- Differenza interquartile
Differenza tra terzo e primo quartile.
Iq=Q3-Q1
- Devianza
Scarto dato dal rapporto tra ogni singola grandezza del campione e la media del campione stesso.
- Varianza
Misura di variabilità che è media delle deviazioni dalla media al quadrato.
Può essere anche definita media quadratica delle differenze (scarti) dei valori rispetto alla media aritmetica.
In piccoli studi si riduce la probabilità di includere i valori più estremi e si rischia così di sottostimare la reale variabilità della Popolazione per questo nel calcolo della Varianza si usa dividere la Devianza per N-1.Se la numerosità è grande non c’è molta differenza tra dividere per N-1 o per N mentre per piccoli campioni ci possono essere variazioni maggiori
- Scarto quadratico medio (deviazione standard)
E' un indice della dispersione dei dati rispetto alla loro media.
Può essere anche definita radice quadrata della varianza.
- Coefficiente di variazione
Rapporto tra scarto quadratico medio e media aritmetica
Per ottienere un numero puro (non espresso in una determinata unità di misura) confrontabile con altri, si moltiplica per 100 (per esprimerlo in %) il rapporto tra la deviazione standard (s) e la media della distribuzione (m). esempio:
Valori medi e deviazioni standard di glicemia e calcemia su un gruppo di soggetti :
Calcemia
Media: 9 mg/100ml
Deviazione standard: 1,5mg/100ml
Glicemia
Media: 85mg/100ml
Deviazione standard: 11mg/100ml
La variabile più dispersa rispetto alla media dei seguenti dati è 16,7% (calcemia)
CALCOLARE DEVIAZIONE STANDARD
Supponiamo di aver ricavato N misure della stessa grandezza x. Con queste abbiamo poi calcolato la media. La media sembra indicare qual è, grosso modo, il valore che possiamo aspettarci scegliendo un dato a caso; in probabilità, si chiama valore atteso. Questo non è necessariamente vero in quanto, calcolata la media, i valori dei dati possono essere molto lontani da questa. Per dare una valutazione dell'incertezza da associare a tale stima, iniziamo col considerare una prima quantità chiamata scarto o deviazione.
Per dare una valutazione dell'incertezza da associare a tale stima, iniziamo col considerare la
DEVIANZA.
Questa differenza fornisce una indicazione di quanto una qualsiasi misura differisce dalla media. In generale, se tutti gli scarti sono molto piccoli, le nostre misure saranno tutte vicine e quindi, presumibilmente, molto precise. Oltre al valore numerico degli scarti, indice di precisione nelle misure, è interessante notarne il segno: le deviazioni possono essere infatti sia positive che negative a seconda che una qualsiasi delle N misure cada a destra o a sinistra della media.
Poiché gli scarti costituiscano un buon punto di partenza per lo studio dell'incertezza da associare alla media, per ovviare all'inconveniente legato alla loro somma, eleviamo al quadrato le singole deviazioni ottenendo tutte quantità positive e quindi in grado di essere sommate tra loro.
Con la somma degli scarti al quadrato (DEVIANZA), divisa per il numero di rilevazioni, è possibile produce la media degli scarti, corrispondente alla VARIANZA (quadrato della DEVIAZIONE STANDARD)
Estraendo la radice quadrata della media degli scarti è possibile ottenere una grandezza compatibile, a livello di unità di misura, con quella di partenza. La grandezza così ottenuta è detta DEVIAZIONE STANDARD (o SCARTO QUADRATICO MEDIO)
La deviazione standard fornisce un'indicazione numerica di quanto i dati siano vicini o lontani dalla media.
esempio:
pazienti ricoverati nel giorno 1: 16
pazienti ricoverati nel giorno 2: 34
pazienti ricoverati nel giorno 3: 10
pazienti ricoverati nel giorno 4: 20
pazienti ricoverati nel giorno 5: 20
pazienti ricoverati nel giorno 6: 20
pazienti ricoverati nel giorno 7: 15
pazienti ricoverati nel giorno 8: 25
pazienti ricoverati nel giorno 9: 20
media: (16+34+10+20+20+20+15+25+20)/9=180/9=20
Applicando la formula della devianza
pazienti neo-ricoverati nel giorno 1: quadrato di (16-20)=16
pazienti neo-ricoverati nel giorno 2: quadrato di (34-20)=256
pazienti neo-ricoverati nel giorno 3: quadrato di (10-20)=100
pazienti neo-ricoverati nel giorno 4: quadrato di (20-20)=0
pazienti neo-ricoverati nel giorno 5: quadrato di (20-20)=0
pazienti ricoverati nel giorno 6: quadrato di (20-20)=0
pazienti ricoverati nel giorno 7: quadrato di (15-20)=25
pazienti ricoverati nel giorno 8: quadrato di (25-20)=25
pazienti ricoverati nel giorno 9: quadrato di (20-20)=0
Applicando la formula della varianza per piccoli studi (divisione della Devianza per N-1)
Totale Devianze=16+256+100+0+0+0+25+25+0=422
Varianza=422/(9-1)=52,75
Applicando la formula della deviazione standard
Deviazione standard=Radice quadrata di 52,75=7,26291952 (arrotonderemo a 7,3 per semplificare)
Questo significa che le misure deve rientrare nell'intervallo (20-7,3) e (20+7,3), cioè tra 12,7 e 27,3 (COEFFICIENTE DI VARIAZIONE = (7,3/20)*100=36,5%).
Le misure che cadono in questo intervallo sono: 16; 20; 20; 20; 15; 25; 20; cioé 7 su 9.
CALCOLO DELLA VARIANZA PER DISTRIBUZIONE DI FREQUENZA
esempio:
In questo esempio la media è: m=(x*m)/n=934/370=2,5
Varianza: va=[((x-m)^2)*n)]/n=1026,28/370=2,77
Deviazione standard: ds=Rad 2,77=1,66
CALCOLO DELLA VARIANZA PER DISTRIBUZIONE DI CLASSI
esempio
In questo esempio abbiamo in media una degenza di 9,2 giorni e le unità si discostano da questo valore in media di 4,7 giorni in più o in meno.
Così, piu' è alta la deviazione standard, tanto meno è informativa la media, perchè i dati si allontanano molto da essa.
Se la Deviazione standard è uguale a zero significa che i miei dati non si discostano dalla media e quindi sono uguali.
2 commenti:
VARIANZA (ottenibile anche dalla radice quadra della DEVIAZIONE STANDARD).
e' l'incontrario!!! la varianza la ottieni elevando al quadrato la deviazione standard
ciao
Valentina
Questo significa che le misure deve rientrare nell'intervallo (20-7,3) e (20+7,3), cioè tra 12,7 e 27,3
Le misure che cadono in questo intervallo sono: 16; 20; 20; 20; 15; 25; 20; cioé 7 su 9.
?????????
Forse c'è un po' di confusione con l' intervallo di confidenza e con il range che contiene il 95% delle misurazioni se la distribuzione è normale
Ciao
Valentina
Posta un commento