Contributo in pubblicazione non scientifica, 2015, ITA

Una applicazione Web per lo studio specialistico dei testi. Il modello adottato e i risultati fino ad oggi ottenuti

Angelo Mario Del Grosso

Istituto Linguistica Computazionale

Il lavoro si concentra sulla realizzazione di una libreria di moduli software relativi ad una applicazione Web per la Textual Scholarship. Tale libreria è basata su un modello che considera la molteplicità degli approcci per analizzare un testo, soprattutto, ma non esclusivamente, antico. In questo quadro il modello prende in considerazione elementi di carattere filologico e linguistico fra i quali anche quelli che derivano dalla Linguistica computazionale. Dal momento che è impensabile che un sistema, sia pure complesso e articolato in sottosistemi, possa ambire a intervenire in qualunque punto della filiera delle analisi scientifiche sui testi, il lavoro è particolarmente apprezzabile perché impostato sulla base di una architettura informatica multi-modulare. In tal modo è possibile inserire nel sistema un cospicuo numero di moduli software ed è aperto alla possibilità di inserirne (o farne inserire) molti altri a seconda di specifiche necessità. Fra i moduli più significativi, sono già attivi quelli per: 1) l'annotazione di parti di testo (dalla singola parola ad una espressione completa, ecc.); 2) la classificazione delle annotazioni stesse secondo una tipologia indicata dall'utente (per esempio, annotazione di tipo semantico, morfologico, ontologico, ecc.); 3) la produzione di indici e concordanze; 4) l'allineamento fra testo e eventuale traduzione (antica o moderna); 5) l'estrazione di named entity (NER). Il modello e i moduli realizzati hanno mostrato grande efficacia in almeno 3 progetti: 1) Progetto PRIN 2008 "Edizione digitale dei manoscritti di F. de Saussure; 2) Progetto ERC advanced grant "Greek into Arabic: Philosophical Concepts and Linguistic Bridges"; 3) Progetto "Traduzione Italiana del Talmud Babilonese". L'applicazione parzialmente già realizzata prevede un auspicabile sviluppo nei prossimi anni con sperimentazioni su testi manoscritti di autori moderni e contemporanei, oltre che su opere antiche e medievali per finalità di critica testuale, è interamente open source e sviluppata con l'utilizzo di standard internazionali, quali,tra l'altro, il sistema di mark-up TEI.

Keywords

computational philology, digital humanities, software enginnering

CNR authors

Del Grosso Angelo Mario

CNR institutes

ILC – Istituto di linguistica computazionale "Antonio Zampolli"

ID: 390562

Year: 2015

Type: Contributo in pubblicazione non scientifica

Creation: 2018-08-30 19:47:43.000

Last update: 2018-09-07 12:29:22.000

External links

OAI-PMH: Dublin Core

OAI-PMH: Mods

OAI-PMH: RDF

External IDs

CNR OAI-PMH: oai:it.cnr:prodotti:390562