Utente:FrescoBot/un

Da Wikipedia, l'enciclopedia libera.
Vai alla navigazione Vai alla ricerca

Apostrofo dopo l'articolo indeterminativo[modifica | modifica wikitesto]

Lo stesso argomento in dettaglio: Articolo indeterminativo.

Corregge il maggior numero possibile di errori del tipo:

  • un idea --> un'idea
  • un'esame --> un esame

L'idea è quella di correggere gli articoli errati solo di fronte a parole sicuramente maschili o femminili. Ad esempio non vanno corretti: "un uniforme" (s.f. o agg?), "un ancora" (s.f. o "un ancora giovane Verdi"?), "un agente" (m o f?).

Inizialmente sostituivo anche una/uno, ma visto l'alto numero di falsi positivi rispetto al numero di errori per il momento ho sospeso.

Ps. Ho controllato sul dizionario tutte le parole di cui non ero assolutamente certo, purtroppo sbagliare è più facile di quello sembra e le infondate segnalazioni di sostituzione errata ne sono la prova. Se trovate qualche errore non esitate a contattarmi immediatamente. Grazie!

Strategia[modifica | modifica wikitesto]

Inizialmente ho scelto le parole da sostituire in base agli errori che ho trovato facendo un controllo campione su poco meno di un migliaio di pagine secondo alcune semplici regole (es. articolo maschile e parola in -a).

Poi, prendendo spunto da un dizionarietto, ho inserito una serie di sostantivi (sempre femminili o sempre maschili) e aggettivi (in -o e in -a ma non in -e) comuni.

Per estendere ulteriormente la copertura ho poi aggiunto con molta attenzione anche alcuni suffissi sempre legati a parole maschili o a parole femminili. (es. -issima, -zione, ecc)

In seguito Nemo, forse vedendo la mia abnegazione, mi ha mandato un suo corposo elenco di parole maschili e femminili prese da un dizionario. Questo elenco, seppur pieno di parole ambigue (ad es. asse, aggettivi in -e, ecc), mi è stato estremamente utile per individuare tutta una serie di sostantivi poco comuni che mi erano scappati.

Ultimamente ho aggiunto molti nuovi aggettivi in -o e in -a all'elenco delle parole da sostituire grazie ad alcune nuove regex che tentano di scovare errate concordanze articolo-aggettivo-sostantivo.