Contributo in atti di convegno, 2014, ITA

Complessità necessaria o stereotipi del "burocratese"? Un'indagine sulla leggibilità del linguaggio amministrativo da una prospettiva linguistico-computazionale

Dominique Brunato

Istituto di Linguistica Computazionale "Antonio Zampolli" (ILC-CNR)

Questo contributo intende presentare una metodologia di ricostruzione del profilo linguistico di un corpus di testi amministrativi basata sull'uso delle tecnologie linguistico-computazionali e finalizzata alla specializzazione di un indice di leggibilità "avanzato" sulle caratteristiche di questi testi. Tale metodologia, documentata in [3], si propone di indagare la variazione linguistica tramite il monitoraggio di parametri estratti automaticamente dal testo sottoposto ad analisi linguistica multi-livello. La complessità della lingua della pubblica amministrazione, soprattutto nei documenti rivolti al cittadino, è un problema ben noto e, malgrado le molteplici iniziative in favore di un linguaggio più chiaro ed efficace, tratti tipici del "burocratese" continuano a persistere, anche quando non imposti da requisiti di legittimità e precisione. Un ausilio alla semplificazione può venire dai sistemi per la misurazione della leggibilità del testo, come suggerito anche dai manuali di stile ispirati alla letteratura del Plain Language. Tuttavia le formule tradizionali, quali Gulpease [2], si limitano ad approssimare la complessità testuale, in quanto considerano esclusivamente parametri del testo superficiali, come la lunghezza della frase e della parola. Più recentemente, è emersa una nuova generazione di indici di leggibilità, fondati su metodologie di Trattamento Automatico del Linguaggio, che riescono a intercettare i luoghi di complessità del testo in maniera più granulare, computando un ampio spettro di parametri linguistici, che risultano anche maggiormente implicati nei processi di comprensione. È il caso di READ-IT [1], lo strumento utilizzato in questo studio. L'analisi linguistica ha esplorato la distribuzione di caratteristiche lessicali, morfo-sintattiche e sintattiche, estratte automaticamente da un "corpus parallelo monolingue" di testi amministrativi, ovvero internamente suddiviso in due sotto-corpora: uno costituito da testi autentici delle pubbliche amministrazioni e uno dalle relative versioni semplificate, frutto di un lavoro di riscrittura coordinato da linguisti. Queste caratteristiche, già risultate predittive del livello di leggibilità di testi giornalistici, sono state selezionate allo scopo di verificare l'incidenza delle peculiarità della scrittura amministrativa nella caratterizzazione della leggibilità. I risultati hanno permesso infatti di discriminare tra aspetti di complessità "ineliminabile" e tratti tipici del burocratese: i primi sono rappresentati da quei parametri che, pur indicativi di maggior complessità nella lingua comune, risultano similmente distribuiti nelle due sottovarietà; i secondi sono invece quelli che contraddistinguono solo la varietà dei testi originali, dunque quelli su cui hanno agito le riscritture. Questi dati potranno supportare tanto lo sviluppo di indici di leggibilità adattati alle peculiarità del linguaggio amministrativo, quanto le ricerche più attuali sulla semplificazione semiautomatica del testo.

XIII Congresso della SILFI (Società Internazionale di Linguistica e Filologia Italiana), Palermo, 22-24 settembre 2014

Keywords

CNR authors

Brunato Dominique Pierina

CNR institutes

ILC – Istituto di linguistica computazionale "Antonio Zampolli"

ID: 311792

Year: 2014

Type: Contributo in atti di convegno

Creation: 2015-02-18 11:00:48.000

Last update: 2015-02-18 11:00:48.000

External IDs

CNR OAI-PMH: oai:it.cnr:prodotti:311792