V di Cramer

Da Wikipedia, l'enciclopedia libera.
Vai alla navigazione Vai alla ricerca

In statistica, la V di Cramer è un indice utilizzato per misurare il grado di associazione tra due variabili nominali il cui il risultato è un valore reale nell'intervallo Si basa sul test del chi quadrato ed è stata pubblicata da Harald Cramér nel 1946[1].

La V di Cramer, nel caso di una tabella di contingenza viene calcolata utilizzando la seguente formula:

dove:

  • è il chi quadrato;
  • è il numero totale di osservazioni;
  • è il numero di colonne;
  • è il numero di righe.

Più il valore della V di Cramer è elevato, maggiore è la forza dell'associazione tra le variabili. In ragione di ciò, essa viene utilizzata come un indice di valutazione della dimensione dell'effetto (effect size) affiancandosi in modo complementare, quindi, all'esito ottenuto tramite il test chi quadrato di Pearson in quanto quest'ultimo, in caso di non accettazione dell'ipotesi nulla, non è in grado di fornire alcun esito relativo alla forza dell'associazione. Poiché la statistica del chi quadrato è sensibile all'ampiezza campionaria, infatti, è possibile ottenere valori di chi quadrato molto elevati, nel caso di un elevato numero di osservazioni, a fronte di una dimensione dell'effetto assai bassa.
Un valore della V di Cramer pari a zero indica una totale mancanza di associazione mentre, al contrario, un valore di 1 indica un'associazione completa. Orientativamente, si può dire che se se il valore ottenuto della V di Cramer è compreso tra 0 e 0,3 si ha una bassa associazione, da 0,3 a 0,6 si ha una buona associazione, da 0,6 a 1 si ha un'ottima associazione. Tali valori sono, tuttavia, sono da considerarsi indicativi in quanto soggetti a variazione in base al contesto ed alla disciplina d'utilizzo[senza fonte].

La V di Cramer può, inoltre, essere calcolata anche per variabili che presentano più di due livelli.

Per tabelle la V di Cramer è equivalente al valore assoluto del coefficiente phi (indicato anche come , o rφ). Il coefficiente phi viene, infatti, calcolato come:

Per la formula della V di Cramer vale, quindi, la seguente uguaglianza:

Correzione[modifica | modifica wikitesto]

Lo stimatore della V di Cramer utilizzato può essere soggetto a distorsione per cui, nel 2012, è stata proposta una correzione da Wicher Bergsma[2].

Sotto l'ipotesi di indipendenza, vale la seguente relazione:

Di conseguenza, venne inizialmente proposta da Čuprov la correzione:

Tale correzione, tuttavia, presenta un problema in quanto può assumere un valore negativo, per cui è stata proposta la nuova correzione:

Questo tipo di correzione, però, fa sì che la radice quadrata dell'errore quadratico medio sia diversa da zero quando vi sia completa dipendenza, per cui è stata proposta la seguente formula finale:

con

Software[modifica | modifica wikitesto]

Nell'ambiente statistico R, è possibile calcolare la V di Cramer tramite le seguenti funzioni:

  1. cramerV() presente nella libreria rcompanion[3];
  2. cramersV() acclusa alla libreria lsr[4].
  3. assocstats() presente nella libreria vcd[5];
  4. cramer.v() acclusa alla libreria questionr[6];

VassarStat: Sezione on-line in grado di calcolare il Test del Chi Quadrato e la V di Cramer da tabelle di contingenza fino ad un massimo di 5X5.[7]

Free Math Help Resources: Sezione on-line in grado di calcolare la V di Cramer da tabelle di contingenza.[8]

Note[modifica | modifica wikitesto]

  1. ^ Cramér, Harald. 1946. Mathematical Methods of Statistics. Princeton: Princeton University Press, page 282 (Chapter 21. The two-dimensional case). ISBN 0-691-08004-6 (table of content Archiviato il 16 agosto 2016 in Internet Archive.)
  2. ^ Wicher Bergsma, A bias correction for Cramér's V and Tschuprow's T, in Journal of the Korean Statistical Society, vol. 42, n. 3, 2013, pp. 323–328, DOI:10.1016/j.jkss.2012.10.002.
  3. ^ Rcompanion: Functions to Support Extension Education Program Evaluation, su CRAN.R-project.org, 16 gennaio 2022.
  4. ^ Lsr: Companion to "Learning Statistics with R", su CRAN.R-project.org, 16 gennaio 2022.
  5. ^ vcd: Visualizing Categorical Data, su cran.r-project.org, 18 gennaio 2022.
  6. ^ questionr: Functions to Make Surveys Processing Easier, su cran.r-project.org, 18 gennaio 2022.
  7. ^ Contingency Table
  8. ^ Cramer's V Calculator - MathCracker.com

Bibliografia[modifica | modifica wikitesto]

Measures of Association for Nominal Variables