In questa pagina si riportano 3 esercizi svolti di Statistica utili per prepararsi all'esame di Statistica - I anno corso di laurea facoltà di Medicina e Chirurgia - Università San Raffaele.
Esercizio n. 1 (indice chi quadrato)
Traccia:
Nel corso di una ricerca vengono intervistati ragazzi e ragazze a cui viene richiesto il tipo di sport praticato. In base ai dati raccolti (vedi tabella), calcolare l'indice chi quadrato per verificare se il tipo di sport è associato o meno al sesso dei ragazzi.
Risoluzione:
Si completa dapprima la tabella delle frequenze assolute osservate fornita dalla traccia del quesito riportando i totali di riga e di colonna:


Svolgendo i calcoli, i valori delle frequenze assolute attese sono i seguenti:
Facendo riferimento alle tabelle delle frequenze assolute osservate e delle frequenze assolute attese, la formula per calcolare l'indice chi quadrato è la seguente:
Applicando la formula precedente al caso in esame, si ottiene il valore dell'indice chi quadrato:
Poichè il valore dell'indice chi quadrato non è prossimo allo zero, le due variabili "tipo di sport" e "sesso dei ragazzi" sono sicuramente associate.
Esercizio n. 2 (test diagnostico)
Traccia:
Viene condotto uno studio per valutare un nuovo test per diagnosticare il tumore al cervello. Per lo studio vengono reclutati 1.000 individui, di cui 450 malati e 550 sani. I risultati dello studio sono riportati nella tabella di seguito:
Calcolare sensibilità e specificità del test diagnostico.
Risoluzione:
Data una tabella di contingenza 2x2 relativa ad un test diagnostico, si possono identificare le seguenti quantità:
- veri positivi (VP): numero di individui malati e positivi al test;
- falsi positivi (FP): numero di individui sani (non malati) e positivi al test;
- veri negativi (VN): numero di individui sani (non malati e negativi al test;
- falsi negativi (FN): numero di individui malati e negativi al test.
Nel caso in esame, alle quantità sopra indicate, si possono associare i seguenti valori:
VP = 425;
FP = 12;
FN = 25;
VN = 538.
La sensibilità di un test diagnostico può essere calcolata mediante la seguente formula:
Applicando la formula precedente al caso in esame, si ottiene il valore della sensibilità:
La specificità di un test diagnostico indica, invece, la probabilità che una persona sana (non malata) riceva un risultato negativo al test e può essere calcolata mediante la seguente formula:
Applicando la formula precedente al caso in esame, si ottiene il valore della specificità:
Entrambi i valori di sensibilità e specificità sono prossimi all'unità (in termini percentuali, probabilità del 94% e del 98% rispettivamente). Si deduce che il test diagnostico risulta essere molto accurato.
Esercizio n. 3 (covarianza e coefficiente di correlazione lineare)
Traccia:
Nella tabella seguente vengono raccolti i dati dell'età (variabile X) e dei valori di colesterolo nel sangue (variabile Y) di 8 individui:
Calcolare la covarianza e il coefficiente di correlazione lineare tra le 2 variabili.
Risoluzione:
La covarianza (SXY) misura come due variabili quantitative X e Y si discostano dai loro valori medi. E' quindi un indicatore sintetico sulla variazione contemporanea dei valori di due variabili quantitative.
La formula per calcolare la covarianza è la seguente:
In alternativa può essere utilizzata un'altra formula, sicuramente più "pratica":
La covarianza misura il segno della relazione lineare tra le due variabili:
- SXY > 0 ⇒ X e Y sono direttamente correlate, pertanto al crescere di X, cresce anche Y;
- SXY = 0 ⇒ X e Y non sono lineramente correlate;
- SXY < 0 ⇒ X e Y sono inversamente correlate, pertanto al crescere di X, Y decresce.
Volendo usare la formula "pratica", si procede al calcolo delle singole quantità necessarie al calcolo della covarianza:
Si riesce quindi a determinare il valore della covarianza relativa alle due variabili X (età) e Y (valore colesterolo):
Poichè il valore della covarianza è positivo, le due variabili sono direttamente correlate, cioè al crescere dell'età crescono anche i valori del colesterolo nel sangue.
Il coefficiente di correlazione lineare di Pearson (ρXY) non solo fornisce un'indicazione sulla direzione della relazione lineare (diretta o inversa) tra due variabili quantitative X e Y (come la covarianza), ma indica anche quanto è forte la relazione lineare (se esiste) fra X e Y.
La formula per calcolare il coefficiente di correlazione lineare di Pearson è la seguente:
dove Sx e Sy indicano i valori delle deviazioni standard delle variabili X e Y.
Il coefficiente di correlazione lineare ρXY è sempre compreso tra -1 e 1 e, in base ai suoi valori, possono essere fatte le seguenti considerazioni:
- ρXY > 0 ⇒ X e Y sono direttamente correlate, pertanto al crescere di X, cresce anche Y; quanto più ρXY è vicino a 1, tanto più è forte la relazione lineare positiva.
- ρXY = 0 ⇒ X e Y non sono lineramente correlate;
- ρXY < 0 ⇒ X e Y sono inversamente correlate, pertanto al crescere di X, Y decresce; quanto più ρXY è vicino a -1, tanto più è forte la relazione lineare negativa.
Si procede al calcolo delle deviazioni standard delle variabili X e Y:
Si riesce quindi a determinare il valore del coefficiente di correlazione lineare ρxy:
Poichè il valore del coefficiente di correlazione lineare è positivo, le due variabili sono direttamente correlate, cioè al crescere dell'età crescono anche i valori del colesterolo nel sangue. Inoltre, essendo il valore di ρxy molto vicino a 1, la relazione lineare positiva è molto forte.
LEZIONI PRIVATE ONLINE CON L'ING. GALEONE
Ti stai preparando per l'esame di Statistica presso la facoltà di Medicina dell'Università San Raffaele?
Prenota ora la tua lezione privata online con l'Ing. Galeone.
Le lezioni saranno individuali e altamente personalizzate...così avrai un aiuto mirato alle tue specifiche esigenze formative!
Per maggiori info contatta l'Ing. Galeone al numero di cellulare 3384610628, anche su WhatsApp.