![]()
|
||||||||||||||||||||
La scelta di una codifica descrittiva per la GuidaI volumi della Guida Generale degli Archivi di Stato si configurano come dei repertori fortemente strutturati, nei quali le informazioni relative ai fondi archivistici posseduti dagli Archivi di Stato sono state ordinate in partizioni e strutturazioni logiche preordinate dai responsabili editoriali dellopera. Lesistenza di una struttura interna nellopera ha suggerito luso dello Standard Generalized Markup Language come linguaggio di codifica del documento elettronico risultante dalla digitalizzazione del documento cartaceo. Coloro che utilizzano
normalmente un computer per comporre testi sanno che un documento elettronico contiene
oltre al testo, una codifica che potremmo definire procedurale in quanto fornisce le
istruzioni necessarie al programma per impaginare a video o in stampa il testo. Lo Standard Generalized Markup Language è un linguaggio per la codifica descrittiva dei documenti. Principi generali di SGMLI primi tentativi di sviluppo di una codifica descrittiva risalgono alla fine degli anni sessanta; ben presto tuttavia si fece strada lidea di elaborare un vero e proprio linguaggio per produrre sistemi di codifica descrittiva e i lavori si conclusero con la pubblicazione dello GML o Generalized Markup Language, trasformato in standard ISO nel 1986. SGML fornisce delle regole per
definire un sistema di codici descrittivi; non prevede alcun meccanismo per associare
questi codici a delle istruzioni per la loro gestione. Questo si traduce in una totale
indipendenza della codifica SGML da ogni software e nella compatibilità assoluta con ogni
piattaforma hardware. Le istruzioni necessarie affinché un programma esegua delle azioni
non possono essere indipendenti, al contrario sono strettamente legate al software. Nel
caso dei documenti SGML queste istruzioni vengono associate ai codici descrittivi mediante
uno strumento chiamato foglio di stile che resta del tutto separato dal testo; in tal modo
lo stesso documento può essere gestito da programmi diversi associato di volta in volta a
diversi fogli di stile. Un sistema di codifica
elaborato secondo le regole SGML si chiama Document Type
Definition o DTD. Nella DTD viene descritta la struttura di un determinato
tipo di documento mediante la definizione degli elementi che lo compongono. Con il termine
elemento si intende indicare una classe di oggetti presenti nel documento, chiaramente
identificabili sulla base del loro contenuto o della loro funzione nel testo. Possono
essere elementi le divisioni interne del documento (capitoli, sezioni, etc.), i titoli, le
note bibliografiche, i nomi propri o geografici, etc. Gli elementi che costituiscono il documento sono ordinati in modo gerarchico partendo da un elemento radice che contiene tutti gli altri, fino agli elementi di base che contengono solamente testo. Alcuni vantaggi delluso di SGMLIl documento elettronico contenente testo e codici descrittivi, unitamente al modello che descrive la struttura gerarchica nella quale si inseriscono gli stessi codici, offre interessanti possibilità.
Concetti fondamentali della sintassi SGMLElementi ed attributiGli oggetti che costituiscono un documento, dalle sue partizioni interne alle informazioni contenute in queste partizioni (nomi, informazioni bibliografiche, etc.) sono chiamati elementi e vengono codificati mediante lintroduzione di un codice o tag che ne evidenzia linizio (open-tag) e da uno che ne segnala la fine (end-tag). esempio: <titolo>Concetti fondamentali della sintassi SGML<\titolo> Gli elementi più complessi contengono al loro interno
gruppi di altri elementi, ad esempio Ogni elemento può avere degli
attributi. Essi servono a specificare delle caratteristiche proprie di ogni occorrenza del
dato elemento, ad esempio Per elaborare la DTD della Guida generale degli Archivi di Stato è stato utilizzato il programma Visual DTD della Corel Draw. Esso rappresenta il modello del documento in modo grafico come una struttura ad albero composta di foglie=elementi. In questa visualizzazione i simboli della sintassi SGML sono trasformati in simboli grafici. Gli elementi sono rappresentati come rettangoli allinterno dei quali è inserito il loro nome. La presenza di attributi è evidenziata da un segno ~ dopo il nome dell'elemento. Indicatori di frequenzaSe, dopo il nome dell' elemento, non è presente alcun indicatore allora una sola occorrenza dellelemento deve essere presente nella posizione prevista. Lindicatore ? indica un elemento facoltativo (da zero ad uno volte). Lindicatore * connota un elemento facoltativo che può ricorrere qualsiasi numero di volte (da zero a n volte). Lindicatore + connota un elemento che deve ricorrere almeno una volta (da 1 a n volte). I simboli
che in SGML indicano quante volte può essere ripetuto un elemento in una determinata
posizione, sono inseriti nel rettangolo che contiene il nome dellelemento e sono
rispettivamente:
Indicatori delle relazioni tra gli elementiI rapporti tra elementi inseriti in un gruppo sono esplicitati da speciali connettori previsti dalla sintassi SGML. Esistono tre simboli che rappresentano tre possibili relazioni:
Simboli usati nella rappresentazione grafica della DTD - GuidaConnettori di elementi:
Contenuto degli elementi terminaliPer definire il contenuto degli elementi non ulteriormente divisibili, SGML fornisce una serie di termini chiave; in Visual DTD sono stati associati a questi termini chiave degli speciali simboli da attaccare al rettangolo che rappresenta un elemento. Nella DTD della Guida sono stati usati solo due tipi di terminali: Un elemento definito come #PCDATA contiene solamente testo; il corrispondente simbolo
grafico è Un elemento definito come EMPTY non deve avere nessun
contenuto; il corrispondente simbolo grafico è Gli elementi in SGML possono essere definiti anche fuori dellalbero gerarchico principale mediante definizioni di "inclusione" o di "esclusione". Le inclusioni servono a specificare che un determinato elemento può essere usato in qualunque posizione allinterno di una determinata struttura. I riferimenti di nota e le note a piè di pagina sono definiti come elementi "inclusive" rispetto alla radice del modello perché non fanno parte della gerarchia principale descritta. Viene usato il simbolo + prima dell' elemento di cui si indica la "inclusione". Dal punto di vista grafico le inclusioni sono rappresentate
dal simbolo In questa struttura l'elemento radice è il capitolo; esso contiene un titolo e una o più sezioni; ogni sezione contiene a sua volta un titolo e uno o più paragrafi. Il numero di pagina può trovarsi in qualunque posizione allinterno del Capitolo e degli elementi ad esso subordinati, Titolo, Sezione e Paragrafo.
La sintassi SGML prevede anche un meccanismo di "esclusione" di elementi da una data struttura. Ad esempio si può stabilire che il numero di pagina non deve mai comparire allinterno di un titolo "escludendo" lelemento num.pagina dal contenuto dellelemento titolo. Viene usato il simbolo - prima dell'elemento escluso
|