Questo contributo propone ed esemplifica un modello per la progettazione di un corpus di riferimento dell’italiano parlato. Nonostante la diffusa attività di raccolta di dati linguistici relativi alla dimensione orale della lingua italiana, rimane ancora assente un corpus di riferimento dell’italiano parlato, frutto di un progetto organico e su larga scala, che sia rappresentativo, ben documentato, liberamente accessibile, e che consenta di produrre risultati generalizzabili. Per questo motivo, il contributo prende avvio da una breve panoramica ragionata dei principali corpora di italiano parlato attualmente esistenti, mettendone in risalto i punti di forza, e individuando al contempo le criticità che ne limitano l’uso nell’ambito della ricerca linguistica. Successivamente, viene delineata l’impostazione metodologica adottata nella costruzione dello Spoken BNC2014 (Love et al. 2017), proponendola come modello – integrabile con altri esistenti – per la composizione di un corpus di riferimento dell’italiano parlato. Infine, descrive i criteri di realizzazione di un progetto sperimentale finalizzato alla creazione di un corpus pilota dell’italiano parlato, che adotta una versione semplificata della metodologia usata nello sviluppo dello Spoken BNC2014. Il contributo si chiude ipotizzando una progettualità concreta per avviare la realizzazione di un corpus di riferimento dell’italiano parlato, nell’ambito di un progetto di ampio respiro, che necessariamente coinvolga una molteplicità di partner.

Verso un corpus di riferimento dell’italiano parlato dialogico: il modello BNC2014

Spina, Stefania
;
Forti, Luciana;Zanda, Fabio
2020-01-01

Abstract

Questo contributo propone ed esemplifica un modello per la progettazione di un corpus di riferimento dell’italiano parlato. Nonostante la diffusa attività di raccolta di dati linguistici relativi alla dimensione orale della lingua italiana, rimane ancora assente un corpus di riferimento dell’italiano parlato, frutto di un progetto organico e su larga scala, che sia rappresentativo, ben documentato, liberamente accessibile, e che consenta di produrre risultati generalizzabili. Per questo motivo, il contributo prende avvio da una breve panoramica ragionata dei principali corpora di italiano parlato attualmente esistenti, mettendone in risalto i punti di forza, e individuando al contempo le criticità che ne limitano l’uso nell’ambito della ricerca linguistica. Successivamente, viene delineata l’impostazione metodologica adottata nella costruzione dello Spoken BNC2014 (Love et al. 2017), proponendola come modello – integrabile con altri esistenti – per la composizione di un corpus di riferimento dell’italiano parlato. Infine, descrive i criteri di realizzazione di un progetto sperimentale finalizzato alla creazione di un corpus pilota dell’italiano parlato, che adotta una versione semplificata della metodologia usata nello sviluppo dello Spoken BNC2014. Il contributo si chiude ipotizzando una progettualità concreta per avviare la realizzazione di un corpus di riferimento dell’italiano parlato, nell’ambito di un progetto di ampio respiro, che necessariamente coinvolga una molteplicità di partner.
2020
Corpora, parlato, italiano.
File in questo prodotto:
File Dimensione Formato  
Stefania Spina, rid44.pdf

non disponibili

Descrizione: Articolo principale
Tipologia: Versione Editoriale (PDF)
Licenza: NON PUBBLICO - Accesso chiuso
Dimensione 513.95 kB
Formato Adobe PDF
513.95 kB Adobe PDF   Visualizza/Apri   Richiedi una copia

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12071/25848
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
social impact