Abhängigkeiten in Computer-Systemen und deren Auswirkungen
Man kann sich spielend in Not bringen, wenn man nicht über Abhängigkeiten und deren Konsequenzen nachdenkt. Manchmal braucht es dazu kleine Katastrophen, wie der komplette Stromausfall in einen Rechenzentrum. Beim Wiederanfahren kann man schon mal in Probleme laufen:
If you have all your DNS servers virtualized which cannot be started because of network or shared storage issues, you can run into problems starting other servers and services that rely on DNS.
Recovering servers, virtual machines after power failure
Man sollte sich immer im Klaren darüber sein, das jede zusätzlich eingebrachte Komponente (Storage, Virtualisierung etc) Probleme machen kann - trotz Hochverfügbarkeit. Lieber viele kleine, als wenige grosse Systeme, ist zumindest meine Erfahrung.
Artikel 2606mal angeschaut
Typischer Fall von selbst schuld. So kritische Infrastruktur wie LDAP und DNS gehört IMHO auf eigene Kisten gepackt, auch wenn die dann im schlechtesten Fall 1% Last haben.
Kommt mir bekannt vor, ich hatte es selber vor wenigen Tagen erlebt. Kollege kam auf die Idee den DC mit DNS zu virtualisieren, dumm nur dass das HA damit nicht ganz klar kam. Lösung war es einen zusätzlichen DNS zu konfigurieren und das VM-Cluster umkonfigurieren.
Prinzipiell geb ich dir recht, manchal ist man aber aufgrund von Platzmangel dazu gezwungen zu konsolidieren… Dabei muss man dann eben kritische Basis-Systeme/Dienste identifizieren und diese seperat betrachten.
Gerade im VMware Umfeld kann man sich da ganz tolle Deadlocks bauen. SQL DB für VC auf physikalischem MS-Cluster. Cluster kommt nur hoch, wenn VMs laufen, VC kommt ohne Cluster nicht hoch, also DC VM ohne VC starten und dann nach und nach den Rest hochfahren.
Schoen, dass das nicht nur mir passiert.
Wir investieren nicht unerheblich viel Zeit in entsprechende Vorausplanungen, damit die beschriebenen Ausfallskaskaden und nachfolgenden Deadlocks nicht auftreten. Vor kurzem hat ein Kollege einen Kalkulator für die Stromverteilung unseres RZ entwickelt. Schaltskizzen und Wiederanlaufpläne existieren, und zwar auf Papier. Gerade diese Notfall-Unterlagen haben uns schon mehrmals den A**** gerettet und längere Ausfälle verhindert.
Der dazu nötige Aufwand spart im Fehlerfall - in dem jede Minute kostbar ist - ganz enorm Zeit. Fehler werden auftreten; Vorbereitetsein ist alles.
Drum mache dir Gedanken um einen Wiederanlauf- und Notfallplan und pflege diese ständig. Es ist auch kein Schaden jemanden für diese Pläne verantwortlich zu machen, der diese Pläne immer aktuell hält.
Bei Virtualisierung dränge auch ich immer darauf eine Instanz auf physikalischer und 1 Instanz auf Vmware abzubilden.