Datenformate
XML
Elektronisch archivieren bedeutet, einen möglichst großen Teil des semantischen, also des inhaltlichen Gehaltes eines Textes aufzuschlüsseln und abzuspeichern. Es bedeutet nicht, eine lediglich layoutorientierte Auszeichnung eines Textes vorzunehmen, wie das beispielsweise geschieht, wenn man Dateien in einem PDF- oder HTML-Format archiviert. Speichert man jedoch eine Datei im XML-Format, erschließt man sich die innere Struktur des Dokumentes, d. h. einen Teil der Semantik des Textes und man erhält eine neue Dimension des Dokumentes.
Diese zusätzliche Informationsebene bietet die Möglichkeit, in einem elektronischen Datenpool eine Maschine und nicht mehr den Menschen selbst nach einer gewünschten Information in den digitalen Archivalien suchen zu lassen. Soll beispielsweise nach einer bestimmten Quelle, einem Autor oder Titel gesucht werden, auf die sich inhaltlich bezogen worden ist, dann ist diese Anfrage in einem XML-codierten Archiv innerhalb von Sekunden realisierbar. Darüber hinaus bietet das XML-Format die Möglichkeit einer automatischen Poststrukturalisierung, d. h. einer weiteren inhaltlichen Aufschlüsselung des Textes mit maschineller Hilfe.
Außerdem erfüllt das XML-Format weitere wichtige Bedingungen eines zuverlässigen und insbesondere in Bezug auf zukünftige Entwicklungen sicheren Fundaments für die Langzeitarchivierung von elektronischen Dateien. Auf Dauer kann z. B. bei Online-Dokumenten voraussichtlich nur schwer das Original-Layout einer Arbeit erhalten werden (z. B. Wegfallen der Unterstützung für bestimmte Fonts). Bei XML-Dokumenten kann mit allen Editoren plattformübergreifend der Inhalt des Dokuments angezeigt werden (content fidelity über page fidelity).
Die wichtigsten Vorteile von XML-Dateien sind
- unabhängig vom Betriebssystem und der jeweiligen Hardware
- ohne Datenverlust konvertierbar in andere Dateiformate
- darstellbar in jeder beliebigen Präsentationsform, sowohl für den Bildschirm wie für den Druck
- XML wird von der ISO (International Organization for Standardization) unterstützt und vom W3C (World Wide Web Consortium) als Standard herausgegeben und empfohlen
Bei der Nutzung dieser Eigenschaften ist die Verfügbarkeit der Online-Dokumente länger gewährleistet. Da XML offen zugänglich und herstellerunabhängig ist und einen Quasi-Standard darstellt sowie Strukturangaben und Formatierungen streng getrennt sind, eignet es sich ausgezeichnet für eine zuverlässige Sicherung der Langzeitverfügbarkeit. Eine automatisierte Darstellung des Dokuments für jeweils aktuelle Bildschirm- oder Druckformate ist möglich.
XMLVersion 1.0 - Standard
des W3C
XMLVersion
1.1 - Standard des W3C
XML-Standard des W3C in
Deutsch
SELFHTML-Einführung in
XML