Il circolo vizioso dell’edizione digitale

Pubblichiamo con piacere la traduzione italiana di un intervento di Desmond Schmidt apparso sul suo blog

La maggioranza delle edizioni scientifiche digitali (digital scholarly editions = DSE) risiedono su server Web sotto forma di un insieme di file (immagini e testo), campi di database e tabelle in formato binario. La struttura dei dati è strettamente legata al software, che prevede che le risorse appaiano in formati e posizioni precise. Dunque lo spostamento di un'edizione digitale scientifica a un altro server Web, che probabilmente possiede un diverso sistema di gestione dei contenuti, diversi linguaggi di scripting e un diverso database, è spesso considerato impossibile o troppo costoso. E prima o poi, a causa di cambiamenti del contesto tecnico causati da aggiornamenti automatici del server, linguaggi e strumenti da cui dipende, ecc. la DSE collasserà. Per arrivare a tale risultato ci vogliono uno o due anni. E potrebbe andare ancora bene se ci fossero le risorse per risolvere il problema, ma frequentemente i tecnici che hanno creato la DSE hanno cambiato progetto, i soldi sono finiti e alla fine quella determinata edizione digitale muore. Tutti sappiamo che questo "ciclo di vita vizioso" si è verificato nel Web innumerevoli volte.

Ma XML ci salverà, non è vero?
Sento persone che dicono: "ma XML ci salverà. Si tratta di un formato di archiviazione permanente che trascende la fragilità del software che gli dà vita." In primo luogo, XML mette in una forma che le persone (ovvero i programmatori) possano leggere quelle speciali strutture di dati che il software ha bisogno di lavorare. Ma non cambia nulla di quanto detto sopra. Certo, XML come metalinguaggio è interoperabile con tutti gli strumenti XML, ma i linguaggi definiti che lo utilizzano, se non rigidamente standardizzati, sono innumerevoli come i granelli di sabbia su una spiaggia e sono altrettanto legati al software che li anima come lo erano i formati binari che lo hanno preceduto.

Sfuggire al circolo vizioso

In secondo luogo, un'edizione digitale scientifica è molto più di una raccolta di trascrizioni e immagini. Semplicemente, non c'è modo di rendere la parte tecnologica di una DSE interoperabile tra sistemi eterogenei. Ma quello che possiamo fare è rendere portabile il contenuto di una DSE fra sistemi che utilizzano diversi database e, in qualche misura, fra diversi sistemi di content management. Questo permette una maggiore longevità a una DSE al di fuori del suo ambiente software originale e permette ai futuri ricercatori di non ricominciare da zero. Quello che abbiamo realizzato di recente nel progetto AustESE è creare un formato portabile di edizione digitale (Portable Digital Edition Format) che racchiude in sé l'edizione scientifica digitale in un unico file ZIP. Tale file contiene:

  1.  I documenti fonte di ogni versione nei formati TEXT e MVD (Multi-Version Document). Il formato MVD rende facile spostare documenti tra le installazioni del sistema AustESE e i file TEXT registrano gli stessi dati in modo più o meno indipendente dal tempo.
  2. Il markup associato al testo. Tale markup è nel formato JSON (JavaScript Object Notation) che attualmente sta soppiantando l'uso di XML nell'invio e nella memorizzazione di dati in molte applicazioni Web. Diversi strati di markup sono possibili per ogni versione del testo e questi possono essere combinati per la produzione di pagine Web.
  3. I formati del testo marcato. Questi definiscono, usando i CSS, differenti rappresentazioni della combinazione testo+markup.
  4. Le immagini alle quali può rimandare il markup.
  5. (In futuro) le annotazioni al testo (nel formato Open Annotation Collaboration) comuni a tutte le versioni cui si applicano.

Tutto ciò rende possibile qualcosa che non credo nessun altro possa fare al momento, ovvero scaricare una DSE per inviarla a un'altra piattaforma e installarla in modo che funzioni 'out of the box'. Abbiamo bisogno di pensare in questi termini se vogliamo andare oltre la fase sperimentale in cui molte edizioni scientifiche digitali sembrano attualmente bloccate. Altrimenti corriamo il rischio di diventare irrilevanti di fronte ai massicci e semplicistici progetti di digitalizzare il nostro patrimonio culturale testuale da parte  di Gutenberg project o Google. Abbiamo bisogno di più di ciò che questi servizi stanno offrendo. Abbiamo bisogno di uno spazio Web in cui trasferire le attività senza tempo di editing, annotazione e ricerca sui testi - quello che noi chiamiamo scholarship. L'unico modo per realizzarlo è quello di creare 'una cosa' che noi chiamiamo edizione scientifica digitale.

(Desmond Schmidt)

2 Commenti su “Il circolo vizioso dell’edizione digitale”

  1. Francesco Stella

    Ringrazio Schmidt e Fiormonte per questo post prezioso, che aiuta a sdrammatizzare il problema della “portabilità” descrivendone il carattere quasi puramente teorico, direi mitologico (perché quello che è portabile sono spesso solo trascrizioni, non il complesso dell’edizione). Cercheremo di testare i suoi toools nel Master in Edizione Digitale di Siena-Arezzo. Spero comunque che il dibattito in corso riesca a tenere presente che un’edizione digitale che abbia valore critico-filologico (scholarly), specie per testi che non ci siano arrivati nella versione già approvata dall’autore (quei testi cioè per i quali l’edizione è più necessaria) non ha semplicemente l’obiettivo di riprodurre semplicemente i documenti di trasmissione ma di ricostruire un originale o almeno un archetipo.

  2. Desmond Schmidt

    Si prega di notare che noi non usiamo XML affatto internamente nel nostro sistema, e così il vecchio giudizi su sistemi basati su XML potrebbe non essere valido. Una cosa che è unico circa il progetto AustESE è che esso è inteso come una soluzione generale al problema del l’edizione digitale accademica. Il formato PDEF è progettato per consentire edizioni completamente caratterizzata da scambiare, aggregati e archiviati. Per esempio, siamo in grado di importare qualsiasi file TEI-Lite in AustESE, e anche esportare il testo e le annotazioni di nuovo in formati multipli.