Verso un corpus di riferimento dell’italiano parlato dialogico: il modello BNC2014

IRIS

Questo contributo propone ed esemplifica un modello per la progettazione di un corpus di riferimento dell’italiano parlato. Nonostante la diffusa attività di raccolta di dati linguistici relativi alla dimensione orale della lingua italiana, rimane ancora assente un corpus di riferimento dell’italiano parlato, frutto di un progetto organico e su larga scala, che sia rappresentativo, ben documentato, liberamente accessibile, e che consenta di produrre risultati generalizzabili. Per questo motivo, il contributo prende avvio da una breve panoramica ragionata dei principali corpora di italiano parlato attualmente esistenti, mettendone in risalto i punti di forza, e individuando al contempo le criticità che ne limitano l’uso nell’ambito della ricerca linguistica. Successivamente, viene delineata l’impostazione metodologica adottata nella costruzione dello Spoken BNC2014 (Love et al. 2017), proponendola come modello – integrabile con altri esistenti – per la composizione di un corpus di riferimento dell’italiano parlato. Infine, descrive i criteri di realizzazione di un progetto sperimentale finalizzato alla creazione di un corpus pilota dell’italiano parlato, che adotta una versione semplificata della metodologia usata nello sviluppo dello Spoken BNC2014. Il contributo si chiude ipotizzando una progettualità concreta per avviare la realizzazione di un corpus di riferimento dell’italiano parlato, nell’ambito di un progetto di ampio respiro, che necessariamente coinvolga una molteplicità di partner.

Verso un corpus di riferimento dell’italiano parlato dialogico: il modello BNC2014

Spina, Stefania;Forti, Luciana;Zanda, Fabio

2020-01-01

Abstract

Questo contributo propone ed esemplifica un modello per la progettazione di un corpus di riferimento dell’italiano parlato. Nonostante la diffusa attività di raccolta di dati linguistici relativi alla dimensione orale della lingua italiana, rimane ancora assente un corpus di riferimento dell’italiano parlato, frutto di un progetto organico e su larga scala, che sia rappresentativo, ben documentato, liberamente accessibile, e che consenta di produrre risultati generalizzabili. Per questo motivo, il contributo prende avvio da una breve panoramica ragionata dei principali corpora di italiano parlato attualmente esistenti, mettendone in risalto i punti di forza, e individuando al contempo le criticità che ne limitano l’uso nell’ambito della ricerca linguistica. Successivamente, viene delineata l’impostazione metodologica adottata nella costruzione dello Spoken BNC2014 (Love et al. 2017), proponendola come modello – integrabile con altri esistenti – per la composizione di un corpus di riferimento dell’italiano parlato. Infine, descrive i criteri di realizzazione di un progetto sperimentale finalizzato alla creazione di un corpus pilota dell’italiano parlato, che adotta una versione semplificata della metodologia usata nello sviluppo dello Spoken BNC2014. Il contributo si chiude ipotizzando una progettualità concreta per avviare la realizzazione di un corpus di riferimento dell’italiano parlato, nell’ambito di un progetto di ampio respiro, che necessariamente coinvolga una molteplicità di partner.

Scheda breve

Scheda completa

Scheda completa (DC)

	Anno
	
				2020
			
	Parole chiave
	
				Corpora, parlato, italiano.
			
	Appare nelle tipologie:
	
				1.1 Articolo in rivista

File in questo prodotto:

File	Dimensione	Formato
Stefania Spina, rid44.pdf non disponibili Descrizione: Articolo principale Tipologia: Versione Editoriale (PDF) Licenza: NON PUBBLICO - Accesso chiuso Dimensione 513.95 kB Formato Adobe PDF Visualizza/Apri Richiedi una copia	513.95 kB	Adobe PDF	Visualizza/Apri Richiedi una copia

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12071/25848

Citazioni

ND

social impact