Artikel-Schlagworte: „backup“

Backup – Auf der Suche nach einem Konzept

Backup war noch nie mein Thema, darum macht es mir auch solche Knoten im Kopf. Ein Konzept a la ‘Ein Client sichert über Server auf ein Band’ ist so dermaßen veraltet, das es sich nicht lohnt irgendeinen Gedanken daran zu verschwenden. Aber wie sieht denn ein modernes Backup-Konzept aus?

Geht man den Weg des Hypes kann man schnell Bullshit-Bingo gewinnen. VTL, Serverless-Backup, Snapshot und Deduplizierung. Bing, Bing, Bing. Und Bonus-Punkte gibt es für Tape backup is dead. Verkompliziert wird das ganze noch durch meine Meinung zu kommerzieller Backup-Software. Sei es ArghServe, NichtBackup oder anderes – mir gehen dabei zumeist die Nackenhaare hoch. Aber mal der Reihe nach:

Tape backup is dead: Nein, ist es nicht. Die Sicherung auf Band ist für mich die letzte Sicherungslinie, wenn alles andere versagt hat. Es soll Firmen geben, die nicht mehr auf Band sichern. Sie verlassen sich auf Backup-to-Disk und/oder VTL. Grob Fahrlässig, wie ich finde, denn sollte einmal etwas mit der Software-Only Lösung sein (Ja, auch WAFL und ZFS können kaputt gehen) wird der Hersteller zuerst fragen, ob man denn ein Backup hat. Meine Daten bringt soetwas nicht wieder. Dann lieber in den Schrank greifen und das Band rausholen.

VTL: Irgendwie will sich mir nicht erschließen welches Problem eine VTL lösen soll. Zugegeben, wenn eine VTL mit Hardware-Komprimierung und Deduplizierung arbeitet lassen sich erstaunliche Datenmengen auf kleinsten Raum speichern, nur wenn ich damit auf Tape möchte ist der Vorteil dahin. Das komprimierte, deduplizierte Ergebniss auf Tape zu ziehen wäre für den K-Fall fatal. Man müßte aus den Bändern erst die VTL wiederherstellen um dann das eigentliche Desaster-Recovery zu starten, das dauert viel zu lange und ist eine mögliche Fehlerquelle zuviel. Irgendwie verglängert sich der Backup-Prozess immer mehr. Primäre-, Sekundäre-Storage, VTL und dann Tape. Spannend dürfte auch die Frage der Kosten sein. Eine VTL kostet unter Umständen eine Stange Geld und man darf nicht vergessen das Backup-Software oft nach Anzahl der Laufwerke und Slots lizensiert wird. Da mag es zwar schön sein, das man 512 SAN-Laufwerke und mehrere tausend Slots mit der VTL emulieren kann, freuen wird das aber nur den Vertriebler der Backup-Software.

Snapshot: Ein Snapshot hat für mich nicht direkt etwas mit Backup zu tun. Klar, es ermöglicht eng beieinander liegende Wiederherstellungspunkte. Eine Stunde ist mit Band unrealistisch, aber trotzdem eine realitätsnahe Anforderung. Zu vergessen sind auch nicht die großen Katastrophen. Wenn es Probleme innerhalb der Storage gibt sind auch schnell die Snapshots weg. Hier wäre imho vielleicht ein Stufenmodell angebracht. Innerhalb eines Tags Snapshots, für den K-Fall den letzten Tag auf Band.

Deduplizierung: Innerhalb einer Appliance macht das noch Sinn. Aber eine Backup-Software, die extra Metadaten für die Deduplizierung irgendwohin schreibt? Schonmal jemand einen Backup-Server aus einen Backup wiederhergestellt? Guter Witz.

Serverless-Backup: Wer auf Full-Backups forever steht, bitte. Ich hab da so meinen Bedenken.

Nun besteht die Welt aber leider nicht nur aus Servern. Große, kleine und mittlere Storage-Systeme sind weit verbreitet, aber wie sieht es da mit dem Desaster-Recovery aus? Gründe warum so ein System versagen kann gibt es mehr als man denkt und nichts ist fataler als viele, viele TB auf einen NAS-System zu haben und nicht heranzukommen. Es gibt NDMP oder propritäre Sachen wie SnapMirror to Tape. Das eine ist File-, das andere Block-basiertes Backup. Beides hat seine Anwendungsgebiete und damit seine Berechtigung.

Um etwas den Knoten zu entwirren habe ich angefangen Backup & Recovery von W. Curtis Preston zu lesen. Ich bin noch nicht weit, aber die ersten zwei Kapitel sind allein ihr Geld wert. Darin geht es um grundsätzliche Fragen, wie zum Beispiel das Excluden besser ist als Includen oder das wenn man wenig zu verlieren hat, wenn man alles sichert, dafür aber unendlich viel Arbeit, wenn man immer nur das nötigste sichern will.

In dem Buch gibt es auch ein Kapitel über Amanda, welches ich mir auch gerade anschaue. Macht einen guten Eindruck. Man kann mit tar & gzip oder dump auf dem Client arbeiten und auf Tape oder Disk sichern oder beides aufeinmal. Clients sind für alle wichtigen Betriebssysteme vorhanden. Charme hat das Format der Sicherung. Notfalls kann man ohne Backup-Server wiederherstellen oder Linux Bare-Metal recovern über eine Knoppix-CD. Auch die Komprimierungs-Rate durch gzip ist nicht zu verachten.

Sorry, wenn das da oben ein paar Gedankensprünge enthält, aber diese Lücken sind ja gerade das Problem. Ich könnte mir vorstellen das ‘Problem’ zwei zu teilen. Backup to Disk für die Clients mit Amanda und das Desaster-Recovery der Filer für mit einer Software auf Tape, die gut mit den Features der Filer klarkommt. Aber ich vermute einfach mal so einfach bleibt es nicht.

Raid doesn’t mean backup!

Bei Slashdot gab es gestern die Geschichte von Journalspace, einem Blog-Hoster, der sämtliche Daten verloren hat, weil man dort RAID als Backup angesehen hat. Sie mussten auf die harte Tour lernen, das dem nicht der Fall ist. Hier nochmal für alle:

(Danke an Marcel für den Link). Und damit das keiner vergisst:

Bart schreibt es euch nochmal auf: RAID is no backup!

Backup My Brain

Mit Vorsicht zu geniessen, das Backup könnte schneller durch sein als erwartet:

Backup my Brain

Klick to enlarge

Links for 2008-04-12

  • pactester – Pactester is a tool to test proxy auto-configuration (PAC) files
  • mylvmbackup – Obtains a read lock on all tables and flushes all server caches to disk, makes an LVM snapshot of the volume containing the MySQL data directory, and unlocks the tables again
  • Hardy Heron – Clean or DirtyAs the release of Ubuntu 8.04 LTS rapidly approaches, the all important question is beginning to form in everyone’s mind. Upgrade, or freshly install Ubuntu ist das neue Windows *kopfschüttel*
Archiv