Contributo in pubblicazione non scientifica, 2015, ITA
Angelo Mario Del Grosso
Istituto Linguistica Computazionale
Il lavoro si concentra sulla realizzazione di una libreria di moduli software relativi ad una applicazione Web per la Textual Scholarship. Tale libreria è basata su un modello che considera la molteplicità degli approcci per analizzare un testo, soprattutto, ma non esclusivamente, antico. In questo quadro il modello prende in considerazione elementi di carattere filologico e linguistico fra i quali anche quelli che derivano dalla Linguistica computazionale. Dal momento che è impensabile che un sistema, sia pure complesso e articolato in sottosistemi, possa ambire a intervenire in qualunque punto della filiera delle analisi scientifiche sui testi, il lavoro è particolarmente apprezzabile perché impostato sulla base di una architettura informatica multi-modulare. In tal modo è possibile inserire nel sistema un cospicuo numero di moduli software ed è aperto alla possibilità di inserirne (o farne inserire) molti altri a seconda di specifiche necessità. Fra i moduli più significativi, sono già attivi quelli per: 1) l'annotazione di parti di testo (dalla singola parola ad una espressione completa, ecc.); 2) la classificazione delle annotazioni stesse secondo una tipologia indicata dall'utente (per esempio, annotazione di tipo semantico, morfologico, ontologico, ecc.); 3) la produzione di indici e concordanze; 4) l'allineamento fra testo e eventuale traduzione (antica o moderna); 5) l'estrazione di named entity (NER). Il modello e i moduli realizzati hanno mostrato grande efficacia in almeno 3 progetti: 1) Progetto PRIN 2008 "Edizione digitale dei manoscritti di F. de Saussure; 2) Progetto ERC advanced grant "Greek into Arabic: Philosophical Concepts and Linguistic Bridges"; 3) Progetto "Traduzione Italiana del Talmud Babilonese". L'applicazione parzialmente già realizzata prevede un auspicabile sviluppo nei prossimi anni con sperimentazioni su testi manoscritti di autori moderni e contemporanei, oltre che su opere antiche e medievali per finalità di critica testuale, è interamente open source e sviluppata con l'utilizzo di standard internazionali, quali,tra l'altro, il sistema di mark-up TEI.
computational philology, digital humanities, software enginnering
ILC – Istituto di linguistica computazionale "Antonio Zampolli"
ID: 390562
Year: 2015
Type: Contributo in pubblicazione non scientifica
Creation: 2018-08-30 19:47:43.000
Last update: 2018-09-07 12:29:22.000
CNR authors
External IDs
CNR OAI-PMH: oai:it.cnr:prodotti:390562