Home News Artikel Community Members über ITnewsbyte.com   
 

Langzeitarchivierung digitaler Daten DISTributed ARchiving NETwork DISTARNET

Die Archivierung digitaler Daten stellt Archive, Forscher und Unternehmen vor neue Anforderungen, ihre Daten über die Zeit zu retten. Das Projekt Distarnet analysiert die verschiedenen Problemlagen.

Diese Seite jetzt zu Ihren Favoriten hinzufügen...  

  Detail  

  Bilder  

    



Details:

Autor: 

Simon Margulies, Imaging & Media Lab, University of Basel / Langzeitarchivierung digitaler Daten DISTributed ARchiving NETwork DISTARNET

Datum: 

08.05.2006 20:44:24






Kopierprozesse in Distarnet
Der Kopierprozess ist einer der zentralsten Prozesse in Distarnet. Damit eine Kopierprozess als erfolgreich bezeichnet werden kann, muss bei jeder Kopie überprüft werden, ob wirklich jedes Byte kopiert und an die richtige Stelle geschrieben wurde. Dazu werden in Distarnet Prüfsummen mit sicheren Hash Algorithmen berechnet (z.B. SHA-1).
Da für die Kopie in einem Netzwerk keine einzelnen grossen Dateien hin- und hergeschickt werden sollten, werden Dateien in Distarnet in kleine Einheiten (momentan 8388608 Bytes) aufgeteilt und einzeln kopiert. Ein Knoten in Distarnet kopiert erst alle Einheiten und stellt dann durch Zusammenfügen die gesamte Datei wieder her. Dabei werden ständig Prüfsummen berechnet und verglichen.
Um den Kopierprozess zu beschleunigen und die Arbeitslast unter den Knoten zu verteilen, werden bereits kopierte Einheiten anderen Knoten zur Kopie vorgeschlagen. Der Knoten, welcher den Kopierprozess ausgelöst hat, muss die Datei deshalb nur einmal ins Netzwerk kopieren.

Metadaten in Distarnet
In einem verteilten System, wo verschiedene Metadatenschemata vereinigt werden, sollten Keywords systemantisch verbunden werden, um eine schema- und netzwerkübergreifende Suche zu ermöglichen. Wenn z. B. ein Teilnehmer des Netzwerkes Hans Müller als ‘Autor’ eines gewissen Buches bezeichnet, und ein anderer Teilnehmer den selben Hans Müller als ‘Schriftsteller’ eines gewissen Buches, dann sollte eine Suche nach Hans Müller, dem ‘Schriftsteller’, auch diejenigen Einträge ergeben, in denen Hans Müller als ‘Autor’ gespeichert ist. Dazu werden formale Übersetzungen zwischen verschiedenen Metadatenstandards und öffentliche Thesauri benötigt. Metadaten werden deshalb in Distarnet in RDF (Resource Description Framework) gespeichert. Eigene Schemata können auf dieses Datenmodell abgebildet und auf andere übersetzt werden.
Die Metadaten und ihre Übersetzung zu anderen Schemata werden im RDF-Store gespeichert. Eine solcher RDF-Store befindet sich in Distarnet auf jedem Knoten. Die semantischen Informationen der Übersetzung werden netzwerkweit verteilt und ermöglichen dadurch, dass eine Suche auf verschiedene Schemata übersetzt werden kann. Diese verteilte Suche wird von jedem betroffenen Knoten in seinem RDF-Store durchgeführt und die Antwort an den Suchenden inklusive aller Übersetzungen zurückgesendet.

[Vorherige]  1 2 3 4 5 6 7 8  [Nächste]







spacer
Member Bereich
Login:
Ihre Emailadresse:

Ihr Passwort:

Auto-Login

Community
Diskutieren Sie diesen Artikel jetzt mit anderen Mitgliedern...
Aktionen:
Gefällt Ihnen diese Seite?
spacer

spacer
spacer spacer spacer
spacer

 sitemap