2.1 Statistica descrittiva
statistica descrittiva
4. Indici di sintesi dei dati
La moda
L’indice detto moda fornisce informazioni su caratteri di tipo qualitativo: esso indica la modalità di un carattere che compare con la massima frequenza. A volte potrebbero esserci due o più modalità con una frequenza massima. In generale si può avere una moda (unimodale), ma anche più mode (plurimodale).
Nell’esempio riguardante il colore degli occhi la moda è il colore marrone in quanto compare con la frequenza massima, come si osserva dalla seguente tabella:
La media
La media (o media aritmetica) è un indice di posizione che si usa nel caso di caratteri quantitativi.
Essa si calcola sommando tutti i valori dei dati registrati e dividendo tale somma per il numero totale di dati.
In formula:
\(x_m = \dfrac{x_1+x_2+...+x_N}{N} = \dfrac{\sum^N_{i=1}{x_i} }{N} \)
Esempio
Un classico esempio è il calcolo della media dei voti.
Supponiamo che uno studente abbia registrato questi voti:
\( \{ 7, 8, 6.5, 5, 8.5 \} \)
La media dei voti è:
\(x_m = \dfrac{7+8+6,5+5+8,5}{5}= 7 \)
La media armonica
La media armonica è un altro tipo di media. La media armonica di \(N\) numeri \( \{ x_1,x_2,...,x_N \}\) è definita come il numero:
\(x_{ma} = \dfrac{N}{\dfrac{1}{x_1}+\dfrac{1}{x_2}+...+\dfrac{1}{x_N}} = \dfrac{N}{\sum^N_{i=1}{\dfrac{1}{x_i}} } \)
Essa si può definire anche come il reciproco della media aritmetica dei valori reciproci \( \{\dfrac{1}{x_1}, \dfrac{1}{x_2}, ...,\dfrac{1}{x_N}\}\).
Esempio
Riprendiamo l'esempio dei voti registrati da uno studente.
Supponiamo che uno studente abbia registrato questi voti:
\( \{ 7, 8, 6.5, 5, 8.5 \} \)
La media armonica dei voti è:
\(x_{ma} = \dfrac{5}{\dfrac{1}{7}+\dfrac{1}{8}+\dfrac{1}{6.5}+\dfrac{1}{5}+\dfrac{1}{8.5}} = 7.35 \)
La mediana
La mediana è un altro indice di posizione usato per caratteri quantitativi. Per calcolare la mediana si ordinano i dati in ordine crescente; a questo punto la mediana è:
- il valore centrale (se il numero totale di dati è dispari)
- la media dei due valori centrali (se il numero totale di dati è pari)
Una caratteristica della mediana è quella di dividere l’insieme dei dati in due parti di uguale numerosità, una parte con valori tutti inferiori alla mediana, l’altra parte con valori superiori ad essa.
Esempio
Riprendiamo l’esempio dei voti registrati da uno studente:
\( \{ 7, 8, 6.5, 5, 8.5 \}\)
Il primo passo per trovare la mediana è riordinare in ordine crescente i valori:
\( \{ 5, 6.5, 7, 8, 8.5 \}\)
Ora possiamo dire che la mediana è il valore centrale, ossia \(7\).
Campo di variazione
Il campo di variazione è la differenza tra valore massimo e valore minimo di una sequenza di numeri.
Nell’esempio riguardante i voti registrati da uno studente il campo di variazione vale: \(8.5-5=3.5\).
Questo indice di dispersione non è molto accurato.
Scarto semplice medio
Lo scarto semplice medio \(S\) è definito come la media aritmetica dei valori assoluti degli scarti tra ogni valore e la media aritmetica \(x_m\). In formula:
\(S = \dfrac{|x_1-x_m|+|x_2-x_m|+...+|x_N-x_m|}{N} \)
Nell’esempio riguardante i voti registrati da uno studente lo scarto semplice medio vale \(1\) (provare a svolgere i calcoli).
La varianza
La varianza è un indice di dispersione che misura quanto i dati di tipo quantitativo si concentrano intorno al valor medio: maggiore è il valore della varianza e tanto più i dati sono dispersi. Essa è definita come la media degli scarti quadratici dalla media aritmetica, e la formula per calcolarla è:
\(Var = \dfrac{\sum^N_{i=1}{(x_i - x_m)^2} }{N} \) dove \(x_m\) è il valor medio o media
Nell’esempio riguardante i voti registrati da uno studente la varianza vale \(1,5\) (provare a svolgere i calcoli).
Lo scarto quadratico medio
Lo scarto quadratico medio è un altro indice di dispersione che si calcola come radice quadrata della varianza:
\(σ = \sqrt{Var} \)
Nel caso dei voti registrati da uno studente abbiamo detto che la varianza vale \(1,5\) e quindi lo scarto quadratico medio sarà \( \sqrt{1,5} = 1,22\).