Questo contributo propone ed esemplifica un modello per la progettazione di un corpus di riferimento dell’italiano parlato. Nonostante la diffusa attività di raccolta di dati linguistici relativi alla dimensione orale della lingua italiana, rimane ancora assente un corpus di riferimento dell’italiano parlato, frutto di un progetto organico e su larga scala, che sia rappresentativo, ben documentato, liberamente accessibile, e che consenta di produrre risultati generalizzabili. Per questo motivo, il contributo prende avvio da una breve panoramica ragionata dei principali corpora di italiano parlato attualmente esistenti, mettendone in risalto i punti di forza, e individuando al contempo le criticità che ne limitano l’uso nell’ambito della ricerca linguistica. Successivamente, viene delineata l’impostazione metodologica adottata nella costruzione dello Spoken BNC2014 (Love et al. 2017), proponendola come modello – integrabile con altri esistenti – per la composizione di un corpus di riferimento dell’italiano parlato. Infine, descrive i criteri di realizzazione di un progetto sperimentale finalizzato alla creazione di un corpus pilota dell’italiano parlato, che adotta una versione semplificata della metodologia usata nello sviluppo dello Spoken BNC2014. Il contributo si chiude ipotizzando una progettualità concreta per avviare la realizzazione di un corpus di riferimento dell’italiano parlato, nell’ambito di un progetto di ampio respiro, che necessariamente coinvolga una molteplicità di partner.
Verso un corpus di riferimento dell’italiano parlato dialogico: il modello BNC2014
Spina, Stefania
;Forti, Luciana;Zanda, Fabio
2020-01-01
Abstract
Questo contributo propone ed esemplifica un modello per la progettazione di un corpus di riferimento dell’italiano parlato. Nonostante la diffusa attività di raccolta di dati linguistici relativi alla dimensione orale della lingua italiana, rimane ancora assente un corpus di riferimento dell’italiano parlato, frutto di un progetto organico e su larga scala, che sia rappresentativo, ben documentato, liberamente accessibile, e che consenta di produrre risultati generalizzabili. Per questo motivo, il contributo prende avvio da una breve panoramica ragionata dei principali corpora di italiano parlato attualmente esistenti, mettendone in risalto i punti di forza, e individuando al contempo le criticità che ne limitano l’uso nell’ambito della ricerca linguistica. Successivamente, viene delineata l’impostazione metodologica adottata nella costruzione dello Spoken BNC2014 (Love et al. 2017), proponendola come modello – integrabile con altri esistenti – per la composizione di un corpus di riferimento dell’italiano parlato. Infine, descrive i criteri di realizzazione di un progetto sperimentale finalizzato alla creazione di un corpus pilota dell’italiano parlato, che adotta una versione semplificata della metodologia usata nello sviluppo dello Spoken BNC2014. Il contributo si chiude ipotizzando una progettualità concreta per avviare la realizzazione di un corpus di riferimento dell’italiano parlato, nell’ambito di un progetto di ampio respiro, che necessariamente coinvolga una molteplicità di partner.File | Dimensione | Formato | |
---|---|---|---|
Stefania Spina, rid44.pdf
non disponibili
Descrizione: Articolo principale
Tipologia:
Versione Editoriale (PDF)
Licenza:
NON PUBBLICO - Accesso chiuso
Dimensione
513.95 kB
Formato
Adobe PDF
|
513.95 kB | Adobe PDF | Visualizza/Apri Richiedi una copia |
I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.