Discussioni progetto:Statistica

Da Wikipedia, l'enciclopedia libera.
Vai alla navigazione Vai alla ricerca

C'è qualcuno attualmente che si occupa di questo progetto? Il dubbio mi sorge perchè l'unico riquadro della pagina, "Voci nuove", se si eccettua un mio contributo, è fermo al 2006. Se il progetto non è attivo, è meglio segnalarlo a Progetto:Coordinamento/Progetti e apporre l'avviso di progetto inattivo. --Agilix (msg) 15:42, 7 nov 2019 (CET)[rispondi]

Scomposizione della devianza[modifica wikitesto]

Per caso ho scoperto ultimamente tre voci poco più che da aiutare:

queste voci pongono diverse problematiche:

  • in italiano la nomenclatura "somma dei quadrati" è decisamente minoritaria, utilizzata solo da non specialisti, perché calco dell'inglese sum of squares. Si preferisce il termine "devianza", anche se ambiguo.
  • le tre voci si riferiscono a termini che non hanno una rilevanza indipendente, e di cui si può dire poco o nulla senza riferirsi al concetto generale di scomposizione della devianza (SST = SSM + SSE). Sono quantomeno da unire, secondo me.
  • la formula scomposizione della varianza, che è praticamente la stessa cosa ma con dei numeratori, rimanda alla voce sull'ANOVA, nella cui sezione Discussione analitica si tratta appunto la scomposizione della varianza, nel caso di associazione con una variabile categorica. Nella voce coefficiente di determinazione si parla della scomposizione della devianza nel caso generico di un modello lineare.

Si potrebbe, volendo, unire le tre voci in una unica voce nuova scomposizione della devianza, che chiaramente ripeterà un po del contenuto delle voci collegate, ma in un'ottica più didattica, che spieghi appunto la scomposizione stessa e non un singolo coefficiente o un metodo come l'ANOVA che ha le sue ragioni e utilizzi. Commenti? --ppong (msg) 15:57, 10 nov 2019 (CET)[rispondi]

Sono d'accordo che così le voci sono abbastanza inutili e andrebbero o ampliate (come in en.wiki, ma mi pare anche lì ci siano problemi) oppure unificate in una voce indipendente o in una già esistente. Io sarei più favorevole a spiegarle meglio nelle voci già esistenti in cui se ne parla senza farne voci indipendenti nuove.--Mat4free (msg) 17:43, 10 nov 2019 (CET)[rispondi]
secondo me non ha senso tenere tutte e tre le voci, andrebbero quantomeno ridotte a redirect. la situazione in en.wiki mi sembra tutt'altro che ottimale, è organizzata tanto male pure lì che esiste una voce per la SST ma non una per la SS in generale. di lì c'è un link che recita "Partitioning [della SST] in the general OLS model" ma invece che puntare alla voce principale sulla scomposizione della devianza, punta a una sezione della voce sulla SSE. non c'è uno schema convincente dietro. --ppong (msg) 22:23, 12 nov 2019 (CET)[rispondi]
Forse non mi sono spiegato bene :) intendevo eliminerei le voci somma dei quadrati spiegata, somma dei quadrati totale e somma dei quadrati residui e spiegherei meglio la decomposizione della devianza e le sue varie parti nelle già esistenti voci ANOVA e coefficiente di determinazione senza creare nuove voci tipo scomposizione della devianza.--Mat4free (msg) 23:39, 12 nov 2019 (CET)[rispondi]
il fatto è che nelle voci ANOVA e coefficiente di determinazione non ci starebbe molto bene un'approfondimento maggiore di questo tema. finisce che eliminiamo le voci sulle tre SS ma non salviamo niente del loro contenuto (che alla fine va anche bene forse) --ppong (msg) 12:23, 1 dic 2019 (CET)[rispondi]
appoggio la proposta di creazione della voce scomposizione della devianza in cui far confluire queste tre voci. --Agilix (msg)

[@ Ppong] Hai ragione, allora in effetti forse potrebbe essere sensato unificarle in una nuova voce scomposizione della devianza, ma allo stato attuale non mi sembra che le tre voci somma dei quadrati spiegata, somma dei quadrati totale e somma dei quadrati residui contengano più informazioni di quelle contenute nelle voci ANOVA e coefficiente di determinazione riguardo questo argomento, quindi ha senso creare una nuova voce unificata scomposizione della devianza se ci si aggiunge qualcosa che non sia già presente nelle due ANOVA e coefficiente di determinazione. Altrimenti cancellerei le tre voci somma dei quadrati spiegata, somma dei quadrati totale e somma dei quadrati residui e basta.--Mat4free (msg) 14:29, 1 dic 2019 (CET)[rispondi]

✔ Fatto ho scritto la voce scomposizione della devianza e ridotto le altre tre a redirect. --ppong (msg) 13:02, 9 dic 2019 (CET)[rispondi]

Falso positivo e falso negativo[modifica wikitesto]

segnalo. --Agilix (msg) 11:08, 12 giu 2021 (CEST)[rispondi]

Ciao, ho aggiunto il significato statistico di "forchetta" nella pagina Forchetta (disambigua), ma poi mi è venuto il dubbio che sia un termine troppo colloquiale e non scientifico. Che ne pensate, lo lasciamo? --Agilix (msg) 11:33, 24 gen 2022 (CET)[rispondi]

Secondo me è un po' colloquiale ma c'è sulla treccani (https://www.treccani.it/vocabolario/forchetta_res-f66348d3-4f51-11dd-9748-0016357eee51_%28Neologismi%29/) e wordreference (https://www.wordreference.com/definizione/forchetta). Però (anche le due fonti precedenti confermano la mia idea) non sono sicuro si intenda necessariamente "intervallo di confidenza" quanto "intervallo di possibile variazione del valore", che è abbastanza diverso dal concetto di intervallo di confidenza. Quindi forse io lo lascerei, ma cambierei la spiegazione del significato.--Mat4free (msg) 14:28, 24 gen 2022 (CET)[rispondi]
Ok, ho corretto. --Agilix (msg) 14:43, 24 gen 2022 (CET)[rispondi]