Covarianza (probabilità)

Da Wikipedia, l'enciclopedia libera.
Vai alla navigazione Vai alla ricerca

In statistica e in teoria della probabilità, la covarianza di due variabili statistiche o variabili aleatorie è un valore numerico che fornisce una misura di quanto le due varino assieme.

Probabilità[modifica | modifica wikitesto]

Definizione[modifica | modifica wikitesto]

La covarianza di due variabili aleatorie e è il valore atteso del prodotto delle loro distanze dalla media:

La covarianza di e può anche essere espressa come la differenza tra il valore atteso del loro prodotto e il prodotto dei loro valori attesi:

Infatti per la linearità del valore atteso risulta

Proprietà[modifica | modifica wikitesto]

La covarianza rispetta le seguenti proprietà, per variabili aleatorie , e , e costanti e :

Due variabili aleatorie indipendenti hanno covarianza nulla, poiché dalla loro indipendenza segue

Due variabili aleatorie che hanno covarianza nulla sono incorrelate.

Due variabili aleatorie dipendenti possono essere incorrelate. Ad esempio, se è una variabile aleatoria di legge uniforme sull'intervallo e , allora

Varianza[modifica | modifica wikitesto]

La covarianza può essere considerata una generalizzazione della varianza

e compare come termine di correzione nella relazione

Più in generale, per variabili aleatorie e vale

come caso particolare di

Statistica[modifica | modifica wikitesto]

In statistica la covarianza di due variabili statistiche e , indicata come , è un indice di variabilità congiunta.

Su una popolazione di osservazioni congiunte , di rispettive medie e , la covarianza osservata è

Uno stimatore della covarianza di osservazioni congiunte può essere ottenuto correggendo la formula della covarianza, dividendo per il numero di gradi di libertà. In questo caso il numero di gradi di libertà è dato dal numero delle osservazioni, , a cui va sottratto il numero di stimatori utilizzati nel computo della covarianza. Nella covarianza entrano le medie campionarie delle , e si può dimostrare che il computo di queste medie corrisponde alla sottrazione di 1 solo grado di libertà (non due, come ci si potrebbe aspettare). Perciò lo stimatore della covarianza è dato da

Lo stimatore della covarianza è anche detto covarianza campionaria.

La varianza e la covarianza intervengono per definire l'indice di correlazione di Bravais-Pearson

La covarianza è limitata dalla disuguaglianza di Cauchy-Schwarz, infatti siano e i vettori degli scarti degli e rispetto alle relative medie, si può applicare la diseguaglianza ottenendo

che equivale a scrivere

Moltiplicando per Un fattore entrambi i lati si ottiene la relazione

dove e sono le deviazioni standard per le due variabili.

Nel caso in cui possiamo dire che la covarianza è limitata nell'intervallo

Infatti, l'espressione generale per la deviazione standard di è

Il valore massimo (minimo), per monotonia delle funzioni, sarà ottenuto in corrispondenza di (), quindi il valore corrispondente di massimo sarà

Osserviamo che il valore massimo è dato dalla somma diretta dei contributi delle incertezze tipo moltiplicate per i relativi coefficienti ottenuti linearizzando la relazione. Si dimostra anche che tale formula è generalizzabile al caso di una funzione dipendente da variabili.

Voci correlate[modifica | modifica wikitesto]

Collegamenti esterni[modifica | modifica wikitesto]

Controllo di autoritàThesaurus BNCF 47720 · GND (DE4140520-1