In questa pagina si riportano 3 esercizi svolti di Statistica utili per prepararsi all'esame di Statistica - I anno corso di laurea facoltà di Medicina e Chirurgia - Università San Raffaele.

 

 

Esercizio n. 1 (indice chi quadrato)

 

Traccia:

Nel corso di una ricerca vengono intervistati ragazzi e ragazze a cui viene richiesto il tipo di sport praticato. In base ai dati raccolti (vedi tabella), calcolare l'indice chi quadrato per verificare se il tipo di sport è associato o meno al sesso dei ragazzi.

 

statistica per medicina san raffaele esercizio1 img1 

 

 

Risoluzione:

Si completa dapprima la tabella delle frequenze assolute osservate fornita dalla traccia del quesito riportando i totali di riga e di colonna:

 

statistica per medicina san raffaele esercizio1 img2

 

Utilizzando i valori totali ottenuti nella tabella delle frequenza assolute osservate, si costruisce la tabella delle frequenze assolute attese:
 
 
statistica per medicina san raffaele esercizio1 img3

 

 

 

Svolgendo i calcoli, i valori delle frequenze assolute attese sono i seguenti:

 

statistica per medicina san raffaele esercizio1 img4

 

 

Facendo riferimento alle tabelle delle frequenze assolute osservate e delle frequenze assolute attese, la formula per calcolare l'indice chi quadrato è la seguente:

 

statistica per medicina san raffaele esercizio1 img5

 

 

Applicando la formula precedente al caso in esame, si ottiene il valore dell'indice chi quadrato:

 

statistica per medicina san raffaele esercizio1 img6

 

 

Poichè il valore dell'indice chi quadrato non è prossimo allo zero, le due variabili "tipo di sport" e "sesso dei ragazzi" sono sicuramente associate.

 
 

 
 
 

Esercizio n. 2 (test diagnostico)

 

Traccia:

Viene condotto uno studio per valutare un nuovo test per diagnosticare il tumore al cervello. Per lo studio vengono reclutati 1.000 individui, di cui 450 malati e 550 sani. I risultati dello studio sono riportati nella tabella di seguito:

 

 

Calcolare sensibilità e specificità del test diagnostico.

 


Risoluzione:

Data una tabella di contingenza 2x2 relativa ad un test diagnostico, si possono identificare le seguenti quantità:

- veri positivi (VP): numero di individui malati e positivi al test;

- falsi positivi (FP): numero di individui sani (non malati) e positivi al test;

- veri negativi (VN): numero di individui sani (non malati e negativi al test;

- falsi negativi (FN): numero di individui malati e negativi al test.

 

 

 

Nel caso in esame, alle quantità sopra indicate, si possono associare i seguenti valori:

VP = 425;    

FP = 12;    

FN = 25;    

VN = 538.

 

 

La sensibilità di un test diagnostico può essere calcolata mediante la seguente formula:

 

 

 

Applicando la formula precedente al caso in esame, si ottiene il valore della sensibilità:

 

 

 

 

La specificità di un test diagnostico indica, invece, la probabilità che una persona sana (non malata) riceva un risultato negativo al test e può essere calcolata mediante la seguente formula:

 

 

 

Applicando la formula precedente al caso in esame, si ottiene il valore della specificità:

 

 

 

 

Entrambi i valori di sensibilità e specificità sono prossimi all'unità (in termini percentuali, probabilità del 94% e del 98% rispettivamente). Si deduce che il test diagnostico risulta essere molto accurato.

 

 


 

 

Esercizio n. 3 (covarianza e coefficiente di correlazione lineare)

 

Traccia:

Nella tabella seguente vengono raccolti i dati dell'età (variabile X) e dei valori di colesterolo nel sangue (variabile Y) di 8 individui:

 

 

Calcolare la covarianza e il coefficiente di correlazione lineare tra le 2 variabili.

 

 

 

Risoluzione:

La covarianza (SXY) misura come due variabili quantitative X e Y si discostano dai loro valori medi. E' quindi un indicatore sintetico sulla variazione contemporanea dei valori di due variabili quantitative.

La formula per calcolare la covarianza è la seguente:

 

 

In alternativa può essere utilizzata un'altra formula, sicuramente più "pratica":

 

 

 

La covarianza misura il segno della relazione lineare tra le due variabili:

- SXY > 0 ⇒ X e Y sono direttamente correlate, pertanto al crescere di X, cresce anche Y;

- SXY = 0 ⇒ X e Y non sono lineramente correlate;

- SXY < 0 ⇒ X e Y sono inversamente correlate, pertanto al crescere di X, Y decresce.

 

Volendo usare la formula "pratica", si procede al calcolo delle singole quantità necessarie al calcolo della covarianza:

 

statistica per medicina san raffaele esercizio3 img4

 

 

Si riesce quindi a determinare il valore della covarianza relativa alle due variabili X (età) e Y (valore colesterolo):

 

statistica per medicina san raffaele esercizio3 img5

 

Poichè il valore della covarianza è positivo, le due variabili sono direttamente correlate, cioè al crescere dell'età crescono anche i valori del colesterolo nel sangue.

 

Il coefficiente di correlazione lineare di Pearson (ρXY) non solo fornisce un'indicazione sulla direzione della relazione lineare (diretta o inversa) tra due variabili quantitative X e Y (come la covarianza), ma indica anche quanto è forte la relazione lineare (se esiste) fra X e Y.

La formula per calcolare il coefficiente di correlazione lineare di Pearson è la seguente:

 

statistica per medicina san raffaele esercizio3 img6

 dove Sx e Sy indicano i valori delle deviazioni standard delle variabili X e Y.

 

Il coefficiente di correlazione lineare ρXY è sempre compreso tra -1 e 1 e, in base ai suoi valori, possono essere fatte le seguenti considerazioni:

- ρXY > 0 ⇒ X e Y sono direttamente correlate, pertanto al crescere di X, cresce anche Y; quanto più ρXY è vicino a 1, tanto più è forte la relazione lineare positiva.

- ρXY = 0 ⇒ X e Y non sono lineramente correlate;

- ρXY < 0 ⇒ X e Y sono inversamente correlate, pertanto al crescere di X, Y decresce; quanto più ρXY è vicino a -1, tanto più è forte la relazione lineare negativa.

 

Si procede al calcolo delle deviazioni standard delle variabili X e Y:

 

statistica per medicina san raffaele esercizio3 img7

 

statistica per medicina san raffaele esercizio3 img8

 

 

Si riesce quindi a determinare il valore del coefficiente di correlazione lineare ρxy:

 

statistica per medicina san raffaele esercizio3 img9

 

Poichè il valore del coefficiente di correlazione lineare è positivo, le due variabili sono direttamente correlate, cioè al crescere dell'età crescono anche i valori del colesterolo nel sangue. Inoltre, essendo il valore di ρxy molto vicino a 1, la relazione lineare positiva è molto forte.

 

 


 

LEZIONI PRIVATE ONLINE CON L'ING. GALEONE

Ti stai preparando per l'esame di Statistica presso la facoltà di Medicina dell'Università San Raffaele?

Prenota ora la tua lezione privata online con l'Ing. Galeone.

Le lezioni saranno individuali e altamente personalizzate...così avrai un aiuto mirato alle tue specifiche esigenze formative!

Per maggiori info contatta l'Ing. Galeone al numero di cellulare 3384610628, anche su WhatsApp.