Il corpus, di 810.715 parole, è costituito da 2.137 testi redatti da altrettanti studenti iscritti al II anno di corsi di studio triennali e magistrali a ciclo unico nell'a.a. 2020/21, raccolti nell'ambito del progetto PRIN 2017 Univers-ITA. L'italiano scritto degli studenti universitari: quadro sociolinguistico, tendenze tipologiche, implicazioni didattiche. Gli studenti che hanno redatto i testi hanno compilato un ricco questionario sociobiografico, che fornisce i metadati confluiti nel corpus. Questi metadati, che consentono di tracciare il profilo degli scriventi, forniscono anche chiavi di ricerca per il corpus stesso. I testi sono stati poi manualmente annotati, evidenziando tutte le forme non adatte a un testo sorvegliato come quello richiesto nella consegna. Anche queste annotazioni rappresentano chiavi di ricerca nel corpus stesso.
Corpus Univers-ITA
Francesca Gallina
;Elena Pistolesi
2023-01-01
Abstract
Il corpus, di 810.715 parole, è costituito da 2.137 testi redatti da altrettanti studenti iscritti al II anno di corsi di studio triennali e magistrali a ciclo unico nell'a.a. 2020/21, raccolti nell'ambito del progetto PRIN 2017 Univers-ITA. L'italiano scritto degli studenti universitari: quadro sociolinguistico, tendenze tipologiche, implicazioni didattiche. Gli studenti che hanno redatto i testi hanno compilato un ricco questionario sociobiografico, che fornisce i metadati confluiti nel corpus. Questi metadati, che consentono di tracciare il profilo degli scriventi, forniscono anche chiavi di ricerca per il corpus stesso. I testi sono stati poi manualmente annotati, evidenziando tutte le forme non adatte a un testo sorvegliato come quello richiesto nella consegna. Anche queste annotazioni rappresentano chiavi di ricerca nel corpus stesso.I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.