hansbuchButton

Antworten

Datensicherung ist Pflicht

Das Oberlandesgericht Karlsruhe entschied, dass EDV-Anwender für die Sicherung ihrer Daten selber verantwortlich sind (Aktenzeichen 10 U 123/95). Im vorliegenden Streitfall wurde ein Softwarehaus verklagt, weil bei der Installation eines Scanners versehentlich eine Kundendatei gelöscht wurde. Die Klage wurde abgewiesen, weil das Softwarehaus zu Recht unterstellen durfte, dass eine Sicherungskopie der sensiblen Daten vorhanden sei.

An den Menschen liegt es immer weniger, wenn wichtige Daten verloren gehen (sie gehen zunehmend verantwortlicher mit ihren Arbeitsergebnissen um), die gängigen technischen Konzepte für die Altagsarbeit sind vorbildlich, und die entsprechenden Systeme - allen voran RAID - nehmen dem kurzfristigen DatenGAU allemal den Schrecken. Wenn aber alte, vermeintlich dauerhaft gespeicherte Projektdaten reaktiviert werden müssen - also Zeichnungen, Ausschreibungen oder auch allgemeine Texte, die vor fünf oder mehr Jahre entstanden sind, wird es oft brenzlich.

Das US-amerikanische "Council on Library and Information Resources" stellte in diesem Zusammenhang Anfang 1998 fest, dass "vom Kochrezept bis zu einem Verzeichnis der Plutoniumlagerstätten digitale Informationen zu verschwinden drohen oder unerreichbar werden". Forschungen des National Media Lab sollen nämlich eine erschreckend kurze Haltbarkeit von Magnetbändern, Disketten und sogar CD-ROMs aufgezeigt haben: "Durchschnittliche CD-ROMs werden nach nur fünf Jahren unzuverlässig", schreibt der Council. Andere Untersuchungen trauen CDs zwar eine Datensicherheit von 20 bis 30 Jahren zu, aber das Thema Datensicherheit bzw. -verlust ist damit nicht befriedigend gelöst.

Aber selbst dann, wenn die gesicherten Daten im technisch binären Sinne noch in Ordnung sein mögen, stellt sich die Fragen nach den Geräten, die für ihre Reaktivierung benötigt werden - man denke z.B. an das antike 5¼-Zoll-Laufwerk, das - falls überhaupt noch vorhanden - möglicherweise seit Jahren nur noch als Lufteinlass zur Rechnerkühlung dient und völlig zugestaubt ist, oder was ist mit dem alte Streamer für die 120MB-QIK-Bänder, dem 44MB-SyQuest-Laufwerk oder der einstigen High-Tech-Box des Schweizer Daniel Bernoulli!? Viele Datensicherungsgeräte der ersten Stunden sind heute kaputt, können in modernen Rechnern gar nicht mehr eingebaut werden, finden kein Interface oder werden von den aktuellen Betriebssystemen nicht mehr unterstützt,

Aber selbst dann, wenn die alten Daten auf die Festplatte zurückgespielt werden können, so ist noch eine dritte Hürde zu nehmen: die reaktivierten Daten müssen von der aktuellen Software noch akzeptiert werden. Aber wer kennt schon noch die Datei-Formate von Framework, Wordstar oder Deluxe Paint. Aber selbst wenn die jeweilige Software noch aktiv vertrieben wird, so ist nicht immer sichergestellt, dass die aktuelle Programm-Version die alten Dateien noch lesen kann .

Verlassen Sie sich immer noch auf Ihre gesicherten Daten? Am besten, man achtet selber auf die Qualität und Langlebigkeit der gesicherten Daten:

  1. Wird eine neue Backup-Technologie angeschafft, sollte man unverzüglich die alten Datenbestände auf die neue Technologie übertragen.

  2. Wer sich auf einen Backup-Typ verlässt, ist verlassen. Neben der Sicherung der täglichen Arbeit auf einem Bandlaufwerk empfiehlt sich parallel die projektbezogenen Sicherung auf z.B. MO-, CD-R-, CD-RW-, DVD-RAM-Systemen - oder was sonst noch kommen mag.

  3. Erscheint eine neue Version einer Software, die neben funktionalen Neuerungen auch ein neues Datenformat verwendet, dann sollten ALLE Dateien SOFORT konvertiert werden. Bereits mehrfach konnte beobachtet werden, dass spätere Versionen verschiedener Programme alte Dateien nicht mehr konvertieren konnten.

  4. Texte, Bilder oder CAD-Dateien sollten nicht nur in dem proprietären Format der jeweiligen Software abgespeichert und gesichert werden, sondern auch in allgemeinen Dateiformaten, wie ASCII-TXT bzw. TIF, TGA oder BMP bzw. DXF, WMF oder HPGL..

  5. Im Zweifelsfalle sollte man ein komplettes System, auf der die Kombination aus Betriebssystem, Backup-Hard- und -Software sowie den Anwendungen einwandfrei funktioniert, nicht verschrotten sondern in Watte gepackt hüten wie den eigenen Augapfel.

Backup

Sicherheitskopie eines Datenstandes, die bei Datenverlust oder -zerstörung eine Möglichkeit bietet, die ursprünglichen Datenbestände wiederherzustellen (siehe auch: Pflicht zur Datensicherung, Wie lange hält eine CD-ROM?)

Wie lange hält eine CD?

Berufsgruppen - wie z.B. Architekten - haben sogar eine Archivierungspflicht. Und damit stellt sich die Frage, WIE kann man Daten am besten längerfristig aufbewahren?

"In 20 Jahren werden viele Daten verloren gegangen sein, die heute auf digitalen CD-ROMs oder Disketten gespeichert sind", fürchtet der US-amerikanische "Council on Library and Information Resources". Vom Kochrezept bis zu einem Verzeichnis der Plutoniumlagerstätten - "digitale Informationen drohen zu verschwinden oder unerreichbar zu werden", warnen die Archivare. Entweder, weil die Medien nicht mehr funktionieren, oder weil die Hardware und Software sie nicht mehr erkennen kann.

Schon jetzt sei es praktisch unmöglich, noch irgendwo 5¼-Zoll-Disketten oder mit WordPerfect 4.0 geschriebene Texte zu lesen, heißt es in einer Presseerklärung des Council. In Regierungsbehörden seien Dectape- und UNIVAC-Laufwerke längst genauso eingemottet wie FORTRAN II. Forschungen des National Media Lab hätten zudem eine erschreckenden kurze Haltbarkeit von Magnetbändern, Disketten und CD-ROMs gezeigt: "Durchschnittliche CD-ROMs werden nach nur fünf Jahren unzuverlässig", schreibt der Council. Hochwertige Mikrofilme und Papier brächten es dagegen auf hundert Jahre und mehr. Fazit des Verbandes: Derzeitige Digital-Medien seien schlicht "inakzeptabel", das Jahr-2000-Problem sei "nichts dagegen", so die Vorsitzende des "Council on Library and Information Resources".

Hersteller wie der CD-Presser Sonopress versichern im Gegensatz dazu: "Eine korrekt gefertigte CD dürfte problemlos 30 Jahre überstehen". Andere Hersteller geben für die "grünen" Rohlinge 75 Jahre und für die "goldenen" 100 Jahre Datensicherheit an. Eine unbeschriebene CD soll zwischen 5 und 10 Jahre gelagert werden können, bevor sie nicht mehr fehlerfrei beschrieben werden kann.

Die Haltbarkeit ist aber auch von der Behandlung und dem Aufbewahrungsort abhängig. Die Haltbarkeitszeiten können sich stark verkürzen, wenn man die CD-Rs starker Sonnenstrahlung, Wärme und/oder einer feuchten Umgebung aussetzt werden. CD-Rs sollten daher ruhig ähnlich vorsichtig behandelt werden wie einst Schallplatten.

Sicherheitskopie / Sicherungsdiskette / Sicherungskopie

  1. Kopien von Datenträgern oder Teilen von Datenträgern auf einem anderen Datenträger, z.B. Disketten, Wechselplatten oder Streamern. Es geht um die Sicherheit vor Datenverlusten.

  2. Kopie von Daten unter einem anderen Namen, in einem anderen Verzeichnis oder auf einem anderen Datenträger - dient als Schutz vor Datenverlust im Falle eines Defektes oder versehentlichen Überschreibens der Originaldaten (siehe auch: Pflicht zur Datensicherung).

Netz / Netzwerk

Verbund von Computern, die über verschiedene Leitungen verbunden sind und sich gemeinsame Ressourcen wie Daten und Peripheriegeräten teilen. Häufig steht in einem Netzwerk ein spezieller Rechner (Server) nur zur Datenverwaltung zur Verfügung, auf den alle anderen Arbeitsstation Zugriff haben.

Man unterschiedet im Wesentlichen LANs, die "unter einem Dach" innerhalb von Firmen und Behörden eingesetzt werden, sowie WANs, die beispielsweise mehrere Filialen in verschiedenen Städten oder Ländern verbinden.

Falls ein Netzwerk vorhanden ist bzw. aufgebaut werden soll:

Netzwerkkarte

Erweiterungskarte, über die der Anschluss an ein Netzwerk hergestellt werden kann oder über die verschiedene Arbeitsstationen miteinander verbunden werden können, um Daten auszutauschen oder Ressourcen gemeinsam benutzen zu können. Da verwundert es nicht, dass manchmal Hersteller von ISDN-Karten diese wie Netzwerkkarten behandeln und konfigurieren.

Server

... von "to serve" (dienen, jemanden versorgen) abgeleitet: zentraler Rechner in einem Netzwerk, der den Arbeitsstationen / Clients Daten, Speicher und Ressourcen zur Verfügung stellt. Auf dem Server ist das Netzwerk-Betriebssystem installiert, und vom Server wird das Netzwerk verwaltet. Im WWW sind Server Knotenpunkte des Netzes.

Ein Server kann aus einem Rechner mit zugehörigem Betriebssystem und einem Dienstprogramm bestehen. Gleichermaßen kann aber auch nur ein Programm gemeint sein, das einen bestimmten Dienst wie einen Domain-Name-Service (DNS) oder Web-Service bereitstellt. Aber diese Dienstprogramme sollen hier keine Rolle spielen, sind sie doch im Endeffekt nur als Anwendung agieren.

Vielmehr gilt es, die unterschiedlichen Server-Klassen und die spezifischen Anforderungen zu beleuchten. "Server-Klasse" bezieht sich in diesem Kontext nicht auf die Größe des Servers - Workgroup- oder Enterprise-Server - sondern ausschließlich auf die Aufgabengebiete, welche die abzudecken sind. Bei einer Klassifizierung nach dem Einsatzbereich ergeben sich sechs verschiedene Server-Klassen mit jeweils eigenem Anforderungsprofil:

  * Ein File-Server stellt seinen Clients Dateien und Platz auf dem Dateisystem bereit. Zusätzlich übernimmt er die Sicherung der Benutzerdateien.

  * Ein Application-Server ermöglicht den Anwendern den Zugriff auf ein oder mehrere Anwendungsprogramme.

  * Auf einem Datenbank-Server läuft eine mehr oder weniger große Datenbank. Die Aufgabe des Servers ist die Verwaltung und Organisation der Daten, die schnelle Suche, das Einfügen und das Sortieren von Datensätzen.

  * Ein Compute-Server bietet möglichst viel Rechenleistung. Typische Beispiele für Compute-Server sind Supercomputer à la Cray in Kernforschungsanstalten.

  * Ein Internet-Server stellt Internet- und Intranet-Dienste bereit. Typische Dienste umfassen das World Wide Web, den Domain Name-Service, FTP sowie E-Mail.

  * (Streaming) Media-Server stellen Multimedia-Daten (z.B. Audio- und Video-Clips) in Echtzeit und höchster Dienstqualität zur Verfügung

Abkürzung für "Redundant Array of Inexpensive Disks" Bei RAID-Systemen steht die Sicherheit von Festplatten-Daten im Vordergrund. Ein RAID-System ist in der Lage, Daten redundant zu speichern, also auf mindestens einer weiteren Festplatte nochmals abzulegen - d. h. vorhandene Daten werden automatisch gespiegelt. RAID-Systeme setzen sich demzufolge immer aus mehreren Festplatten zusammen.

Da inzwischen Festplatten nicht mehr all zu teuer sind, werden RAID-Systeme vermehrt auch eingesetzt, um einfach nur große Datenmengen speichern zu können. Im RAID System ist dazu ein Festplatten-Controller notwendig, der über integrierte Management-Funktionen verfügt. Dazu kommen ein Netzteil, das genügend Power zur Verfügung stellt, sowie eine Software, die es erlaubt, das RAID-System möglichst flexibel zu verwalten. Für die Anwendungen und für angeschlossene Rechner stellt sich das Array (die Batterie einzelner Festplatten) als eine große Festplatte dar; die Daten-Verwaltung - welche Daten werden wo abgelegt? - wird vom System selbst übernommen.

Ein Merkmal moderner RAID-Systeme besteht - neben der Sicherheit - zudem darin, dass defekte Platten im laufenden Betrieb ausgetauscht werden können, so dass außer den Netzwerkadministratoren üblicherweise niemand von einem Ausfall etwas merkt.

RAID ist nicht gleich RAID

Es existieren mehrere "RAID-Levels", die über unterschiedliche Leistungsmerkmale verfügen. Die Grundlage der RAID-Technologie wird durch so genannte "Stripe Sets" gebildet (stripe = Streifen). Dabei werden relativ kleine Datenblöcke - im Bereich von einigen KByte - auf einer oder auf mehreren Festplatten verteilt.

Ursprünglich wurden die RAID-Levels 1 bis 5 definiert. Mitte der 90er Jahre sind noch die Levels 6 und 7 hinzugekommen. Allerdings kann vom Zahlenwert eines Levels nicht direkt auf die Qualität oder auf die Funktionalität des entsprechenden RAID-Systems geschlossen werden. Es handelt sich lediglich um eine von Professoren der Universität Berkeley ziemlich willkürlich gewählte Art der Bezeichnungsfindung. Da aber selbst diese Untergliederung noch nicht ausreicht, um sämtliche Leistungsmerkmale von RAID Systemen zu spezifizieren, werden auch Kombinationen dieser Benennungen verwendet.

RAID 0

Der RAID-Level 0 wird auch als "Non-Redundant Striped Array" bezeichnet. Die "0" steht also für "keine Redundanz" bzw. "keine Sicherheit".

  * Im RAID-0-System werden zwei und mehr Festplatten zusammengeschaltet, um die Schreib-Lese-Geschwindigkeit zu erhöhen - z.B. zur Verarbeitung von digitalen Video-Daten.

  * Die beim Benutzer entstehenden Daten werden in kleine Blöcke mit einer Größe von 4 bis 128 KByte aufgeteilt.

  * Diese Blöcke werden abwechselnd auf den Platten des RAID-0-Arrays gespeichert. So kann auf mehrere Platten gleichzeitig zugegriffen werden, was die Geschwindigkeit insbesondere bei sequenziellen Zugriffen erhöht.

Da bei RAID 0 keine redundanten Informationen erzeugt werden, gehen Daten verloren, wenn eine RAID-Platte ausfällt. Und da die Daten einer Datei auf mehrere Platten verteilt sind, lassen sich auch keine zusammenhängenden Datensätze mehr reproduzieren, selbst wenn nur eine Platte im RAID-0-Array ausfällt.

RAID 1

In einem RAID-1-System, auch "Drive Duplexing" genannt, werden auf zwei Festplatten identische Daten gespeichert. Es ergibt sich damit eine Redundanz von 100 Prozent. Fällt eine der beiden Platten aus, so arbeitet das System mit der verbleibenden Platte ungestört weiter. Die hohe Ausfallsicherheit dieses Systems wird allerdings meist nur in relativ kleinen Servern eingesetzt, da bei RAID 1 die doppelte Platten-Kapazität benötigt wird, was sich bei großen Datenmengen schnell finanziell bemerkbar macht.

RAID 2

Das RAID 2-System teilt die Daten in einzelne Bytes auf und verteilt sie auf die Platten des Platten-Arrays. Der Fehlerkorrekturcode (ECC = Error Correction Code) wird nach dem Hamming-Algorithmus berechnet und auf einer zusätzlichen Platten gespeichert. Da in allen modernen Festplatten bereits Methoden zur Fehlerkorrektur enthalten sind, spielt dieser RAID-Level in der Praxis keine große Rolle mehr.

RAID 3

In einer RAID-3-Konfiguration werden die Daten in einzelne Bytes aufgeteilt und dann abwechselnd auf den - meistens zwei bis vier - Festplatten des Systems abgelegt. Für jede Datenreihe wird ein Parity-Byte hinzugefügt und auf einer zusätzlichen Platte - dem "Parity-Laufwerk" - abgelegt. Beim Ausfall einer einzelnen Festplatte können die verloren gegangenen Daten aus den verbliebenen sowie den Parity-Daten rekonstruiert werden. Da moderne Festplatten und Betriebssysteme aber nicht mehr mit einzelnen Bytes arbeiten, findet auch der RAID-Level 3 kaum noch Verwendung.

RAID 4

Prinzipiell ist RAID 4 mit RAID 3 vergleichbar. Nur werden die Daten nicht in einzelne Bytes, sondern in Blöcke von 8, 16, 64 oder 128 KByte aufgeteilt. Beim Schreiben von großen sequenziellen (zusammenhängenden) Datenmengen lässt sich so eine hohe Performance erreichen. Werden verteilte Schreibzugriffe vorgenommen, muss jedes Mal auf den Parity-Block zugegriffen werden. Für viele kleine Zugriffe ist RAID 4 demnach nicht geeignet.

RAID 5

Beim RAID-5-Level werden die Parity-Daten - im Unterschied zu Level 4 - auf allen Laufwerke des Arrays verteilt. Dies erhöht die Geschwindigkeit bei verteilten Schreibzugriffen. Engpässe durch die spezielle Parity-Platte können nicht entstehen. Bedingt durch diese Vorteile hat sich RAID 5 in den letzten Jahren beliebteste RAID-Variante für PC-Systeme etabliert.

RAID 6

RAID 6 bietet die höchste Datensicherheit. Dabei wird zum RAID-5-Verfahren eine weitere unabhängige Paritäts-Information auf einem zusätzlichen Laufwerk hinzugefügt. Dadurch werden allerdings die Schreibzugriffe wieder etwas langsamer.

RAID 7

Auch RAID 7 ist ähnlich wie RAID 5 aufgebaut. In der RAID-Steuereinheit wird bei RAID 7 aber zusätzlich ein lokales Echtzeitbetriebssystem eingesetzt. RAID 7 benutzt schnelle Datenbusse und mehrere größere Pufferspeicher. Die Daten in den Pufferspeichern und auf den Laufwerken sind von der Datenübertragung auf dem Bus abgekoppelt (asynchron). So werden alle Vorgänge gegenüber den anderen Verfahren erheblich beschleunigt. Ähnlich wie bei RAID 6 kann die Paritätsinformation für eines oder mehrere Laufwerke generiert werden. Es lassen sich gleichzeitig unterschiedliche RAID-Level nutzen.

RAID 10 bzw. RAID 0+1

Eigentlich handelt es sich bei RAID 10 nicht um einen eigenen RAID-Level, sondern lediglich um die Kombination von RAID 1 mit RAID 0. Damit werden die Eigenschaften der beiden "Mutter-Levels" - Sicherheit und sequenzielle Performance vereinigt.

Bei RAID 10 werden üblicherweise vier Festplatten verwendet, denn dieses System verlangt nach zwei Paaren gespiegelter Arrays, die dann zu einem RAID-0-Array zusammengefasst werden. RAID 10 eignet sich insbesondere zur redundanten Speicherung von großen Dateien. Da hierbei keine Parität berechnet werden muss, sind die Schreibzugriffe mit RAID 10 sehr schnell. RAID 10 gilt übrigens auch als zusätzlich gestripte Version von RAID 1.

RAID 30

RAID 30 wird eingesetzt, wenn große Dateien sequenziell übertragen werden sollen. Es handelt sich um eine zusätzlich gestripte Version von RAID 3. Diese Version wurde von AMI (American Megatrends) entwickelt. Sie bietet Datensicherheit und sehr hohen Durchsatz. RAID 30 ist komplexer als niedrigere RAID-Level und benötigt mehr Platten. AMI benutzt RAID 30 mit sechs Festplatten.

RAID 30

Werden sowohl große Datensicherheit wie auch schnelle Zugriffszeiten und hohe Datentransfer-Raten benötigt, empfiehlt sich RAID 50. Auch diese Version stammt von AMI. Sie ist ebenfalls komplexer als niedrigere RAID-Level und benötigt ebenfalls sechs Festplatten. RAID 50 ist die gestripte Version von RAID 5.

Andere Kombinationen:

Aus den genannten RAID-Leveln lassen sich noch viele weitere Kombinationen ableiten. In der Praxis erstellen sich größere Unternehmen maßgeschneiderte Einzellösungen, die zwar auf einer oder mehreren RAID-Technologien basieren, jedoch nicht direkt in die genannten RAID-Standards eingereiht werden können. Beliebt sind beispielsweise auch die Kombinationen aus RAID 0 und 3 oder aus RAID-Level 3 und 5. Hier beginnt allerdings schon das Bezeichnungschaos, denn die Kombination aus 0 und 3 wird mit RAID 53 bezeichnet, und die Kombination aus 3 und 5 nennt sich schließlich RAID 8.

Aus den genannten RAID-Leveln lassen sich noch viele weitere Kombinationen ableiten. In der Praxis erstellen sich größere Unternehmen maßgeschneiderte Einzellösungen, die zwar auf einer oder mehreren RAID-Technologien basieren, jedoch nicht direkt in die genannten RAID-Standards eingereiht werden können. Beliebt sind beispielsweise auch die Kombinationen aus RAID 0 und 3 oder aus RAID-Level 3 und 5. Hier beginnt allerdings schon das Bezeichnungschaos, denn die Kombination aus 0 und 3 wird mit RAID 53 bezeichnet, und die Kombination aus 3 und 5 nennt sich schließlich RAID 8.

Neben den verschiedenen RAID-Levels existieren zusätzlich noch diverse Implementierungen von RAID. Bei Software-RAID-Lösungen beispielsweise wird ein Treiber ins Betriebssystem integriert, der RAID-Funktionalitäten enthält. Praktisch alle modernen Server-Betriebssysteme unterstützen verschiedene RAID-Levels. Allerdings sollte bei einer solchen Lösung zusätzliche Prozessor-Leistung eingeplant werden. ABER ACHTUNG: Ein nicht zum RAID gehörendes Boot-Laufwerk, von dem der spezielle RAID-Treiber geladen werden soll, würde die angestrebte Sicherheit bei einem Ausfall sofort zunichte machen.

Ein externes RAID-System (SCSl to SCSI RAID) - eine hardwarebasierende RAID-Lösung - kennt diese Probleme dagegen nicht. Das Betriebssystem kann dabei direkt vom RAID-Controller geladen werden. Hier wird die RAID Funktionalität vom Controller gesteuert. Auch "Zwitterlösungen" sind verfügbar. So werden bei der AAA- oder bei der ARO-Serie von Adaptec RAID-Treiber auf dem Server eingesetzt, während die Berechnung der Redundanz-Informationen (Parität) auf einen Coprozessor auf dem RAID-Hostadapter ausgelagert ist.

Echte Hardware-RAID-Controller können (meist über SCSI an den Server angebunden) in einem eigenen Gehäuse untergebracht sein, was allerdings eine relativ teure Lösung ist. Im PC Server-Bereich finden sich meist Host-basierende RAID-Lösungen, wobei der Controller direkt in den Server eingesteckt wird. Damit sind sehr hohe Transferraten möglich, und die Konfiguration ist äußerst flexibel.

ÜBRIGENS: Nicht nur dann, wenn das RAID System zur Erhöhung der Datensicherheit eingesetzt wird, empfiehlt sich der Einsatz einer unterbrechungsfreien Stromversorgung (USV) und von Überspannungssteckern.

[Hansbuch] [Herstellerkonzepte] [Betriebssicherheit] [Häufig gestellte Fragen] [Antworten] [Rechtswesen] [Sitesicht] [Impressum] [Kontakt]