Il corpus, di 810.715 parole, è costituito da 2.137 testi redatti da altrettanti studenti iscritti al II anno di corsi di studio triennali e magistrali a ciclo unico di 44 Atenei nell'a.a. 2020/21, raccolti nell'ambito del progetto PRIN 2017 “Univers-ITA. L'italiano scritto degli studenti universitari: quadro sociolinguistico, tendenze tipologiche, implicazioni didattiche”. Il campione di partecipanti è rappresentativo sia per aree disciplinari (umanistica, scientifica, sanitaria, sociale), sia per aree geografiche (nord, centro, sud+isole). I testi, mediamente di 400 parole, sono stati compilati secondo una traccia comune. I testi sono stati sottoposti ad una rigorosa analisi, sia quantitativa (attraverso un software che ha identificato caratteristiche come il numero di parole diverse, il numero di frasi, ecc.) sia qualitativa (attraverso una annotazione manuale di tutti i fenomeni devianti rispetto a quanto previsto dalla grammatica normativa dell’italiano rispetto a categorie come ortografia, punteggiatura, coesione e coerenza testuale, ecc.). I 2.137 studenti, dopo aver redatto i testi, hanno compilato un questionario sociobiografico di 58 domande, suddiviso in quattro sezioni: Profilo personale e familiare; Biografia linguistica e educativa; Consumi culturali; Atteggiamenti ed esperienze relativi alla scrittura. Le risposte fornite alle domande del questionario, al pari delle annotazioni qualitative e dei dati quantitativi, rappresentano il ricchissimo apparato di metadati del corpus. Questi metadati consentono di operare ricerche con grado elevato di complessità e di individuare correlazioni sistematiche tra caratteristiche strutturali dei testi e profili degli scriventi. Il corpus rappresenta ad oggi l’unica mappatura sistematica e rappresentativa delle competenze di scrittura formale degli studenti universitari e può essere utilizzato, dagli atenei, come base per costruire percorsi didattici finalizzati al rafforzamento delle competenze di scrittura.
Corpus UniverS-Ita
Elena Pistolesi
2023-01-01
Abstract
Il corpus, di 810.715 parole, è costituito da 2.137 testi redatti da altrettanti studenti iscritti al II anno di corsi di studio triennali e magistrali a ciclo unico di 44 Atenei nell'a.a. 2020/21, raccolti nell'ambito del progetto PRIN 2017 “Univers-ITA. L'italiano scritto degli studenti universitari: quadro sociolinguistico, tendenze tipologiche, implicazioni didattiche”. Il campione di partecipanti è rappresentativo sia per aree disciplinari (umanistica, scientifica, sanitaria, sociale), sia per aree geografiche (nord, centro, sud+isole). I testi, mediamente di 400 parole, sono stati compilati secondo una traccia comune. I testi sono stati sottoposti ad una rigorosa analisi, sia quantitativa (attraverso un software che ha identificato caratteristiche come il numero di parole diverse, il numero di frasi, ecc.) sia qualitativa (attraverso una annotazione manuale di tutti i fenomeni devianti rispetto a quanto previsto dalla grammatica normativa dell’italiano rispetto a categorie come ortografia, punteggiatura, coesione e coerenza testuale, ecc.). I 2.137 studenti, dopo aver redatto i testi, hanno compilato un questionario sociobiografico di 58 domande, suddiviso in quattro sezioni: Profilo personale e familiare; Biografia linguistica e educativa; Consumi culturali; Atteggiamenti ed esperienze relativi alla scrittura. Le risposte fornite alle domande del questionario, al pari delle annotazioni qualitative e dei dati quantitativi, rappresentano il ricchissimo apparato di metadati del corpus. Questi metadati consentono di operare ricerche con grado elevato di complessità e di individuare correlazioni sistematiche tra caratteristiche strutturali dei testi e profili degli scriventi. Il corpus rappresenta ad oggi l’unica mappatura sistematica e rappresentativa delle competenze di scrittura formale degli studenti universitari e può essere utilizzato, dagli atenei, come base per costruire percorsi didattici finalizzati al rafforzamento delle competenze di scrittura.File | Dimensione | Formato | |
---|---|---|---|
vademecum.pdf
accesso aperto
Descrizione: banche dati
Tipologia:
Altro materiale allegato
Licenza:
Copyright dell'editore
Dimensione
2.35 MB
Formato
Adobe PDF
|
2.35 MB | Adobe PDF | Visualizza/Apri |
I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.