Wie Dynamic Quorum dafür sorgt, dass Exchange 2013-Cluster während eines Fehlers ausgeführt werden

Wenn Sie eine Datenbankverfügbarkeitsgruppe ausführen, die auf zwei Standorte aufgeteilt ist, und das primäre Rechenzentrum herunterfahren müssen – das beispielsweise Postfachserver und den Dateifreigabezeugen -, müssen Sie traditionell in Betracht ziehen, den FSW auf den sekundären zu verschieben Standort oder Risiko, dass die DAG das Quorum verliert und herunterfährt. Wenn Sie in einem Rechenzentrum die Stromversorgung verlieren, kann dies problematischer sein. Das dynamische Quorum kann solche Situationen jedoch erleichtern.

Was macht das dynamische Quorum?

Dynamic Quorum ist eine neue Funktion in Windows Server 2012, mit der Ihr Cluster-Quorum automatisch so angepasst wird, dass weniger als die Hälfte des Clusters ausgeführt wird, solange andere Knoten ordnungsgemäß heruntergefahren werden. In früheren Versionen von Windows (und Exchange) musste mehr als die Hälfte der Online-Knoten in einem Cluster mit Mehrheitsknotensatz arbeiten. Das dynamische Quorum hebt diese Einschränkung auf.
Um dies zu veranschaulichen, verwenden wir eine einfache Umgebung mit einem Exchange mit zwei Knoten TAG verteilt auf zwei Standorte (Abbildung 1). Das erste Rechenzentrum fungiert als primärer Standort für Exchange und hostet den FSW zusammen mit dem ersten Exchange-Knoten. Das zweite Rechenzentrum hostet den zweiten Server.
In dieser Art von Umgebung handelt es sich nicht unbedingt um einen Disaster Recovery-Standort, sondern um zwei gut verbundene Rechenzentren, die möglicherweise nahe beieinander liegen und als Teil desselben Standorts fungieren können. Wir gehen davon aus, dass es auch ein Paar Hardware-Load-Balancer gibt, die automatische Funktionen bereitstellen Failover zwischen Rechenzentren, ausfallsichere Internetverbindung und Kommunikationsverbindungen zur Organisation. Diese Load Balancer stellen sicher, dass Exchange Server über alles verfügt, was erforderlich ist, um bei einem Ausfall des Rechenzentrums online zu bleiben.

Exchange-Datenbankverfügbarkeitsgruppe

Abbildung 1: Exchange-DAG mit zwei Knoten und FSW.

DAG-Ausfallsicherheit ohne dynamisches Quorum

Schauen wir uns an, wie eine normale DAG für Exchange 2010, die unter Windows Server 2008 R2 ausgeführt wird, während eines Knotenausfalls ohne dynamisches Quorum funktioniert. Im ersten Beispiel soll eine typische DAG vor einem Ausfall eines einzelnen Knotens schützen (Abbildung 2). Wir erwarten, dass der Cluster und die DAG online bleiben.

Knoten, Verlust des Rechenzentrums

Abbildung 2: Verlust des zweiten Knotens oder Rechenzentrums.

Ein weiteres Szenario beinhaltet den Verlust des Cluster-Quorums und das Herunterfahren der DAG (Abbildung 3). Wenn wir einen Knoten und den FSW verlieren, ist die DAG offline – auch wenn beide sauber heruntergefahren werden.

Dateifreigabe Zeugenverlust

Abbildung 3: Verlust des ersten Knotens und des FSW.

Bei einem geplanten Herunterfahren des Rechenzentrums, bei dem die Stromversorgung des Rechenzentrums und eines Hosts häufig sauber unterbrochen wird, hätten wir die Möglichkeit, den FSW in einen Host im sekundären Rechenzentrum umzuwandeln. Dies ermöglicht Wartungsarbeiten, hilft jedoch nicht bei dem unvermeidlichen Ereignis, dass eine Klimaanlage an einem Wochenende überhitzt, Server heruntergefahren werden, E-Mails nicht mehr funktionieren – und jemand alles wieder in Betrieb nehmen muss.
Das dynamische Quorum mit Windows Server 2012 und Exchange 2013 schützt nicht nur vor diesem Szenario, sondern auch vor Szenarien, in denen sich die meisten Knoten befinden Ein Cluster schlägt fehl. In einem anderen Beispiel sehen wir, dass wir am primären Standort sowohl einen Exchange-Knoten als auch den FSW verloren haben (Abbildung 4).
In unserem Beispiel kann Dynamic Quorum vor einem Ausfall des Rechenzentrums schützen, während die Exchange-DAG online bleibt. Dies bedeutet, dass unter den gegebenen Umständen (wir werden gleich darauf zurückkommen) ein Stromausfall in Ihrem primären Rechenzentrum auftreten kann und Exchange weiterhin in Betrieb bleiben kann. Dies kann sogar in kleineren Umgebungen der Fall sein, ohne dass der FSW an einem dritten Standort platziert werden muss.

FSW-Verlust mit Dynamic Quorum

Abbildung 4: Verlust des ersten Knotens und des FSW mit dynamischem Quorum.

Die wichtigste Einschränkung ist, dass der Cluster sauber heruntergefahren werden muss. Im vorherigen Beispiel, in dem das erste Rechenzentrum ausgefallen ist, haben wir uns auf einen Mechanismus zur Koordinierung des Herunterfahrens des Rechenzentrums verlassen. Dies muss nicht kompliziert sein, und in einem gut gestalteten Rechenzentrum ist dies häufig integriert.
Dies kann auch vor einem anderen Szenario schützen, in dem Exchange-DAGs mit drei Knoten in einer ähnlichen Konfiguration vorhanden sind – wobei zwei Exchange-Knoten im ersten Rechenzentrum und ein einzelner Knoten in einem zweiten Rechenzentrum vorhanden sind. Da die beiden Knoten im ersten Rechenzentrum sauber heruntergefahren werden, stellt Dynamic Quorum sicher, dass der verbleibende Knoten die DAG online hält.

Dynamisches Quorum kann nicht vor allem schützen

Dynamic Quorum ist nicht für alle Failover-Szenarien von Rechenzentren eine Silberkugel. Daher müssen Sie immer noch Verfügbarkeitstechnologien für Katastrophen größeren Ausmaßes berücksichtigen. Sie können die Koordinierung der Datenbankaktivierung in Betracht ziehen, mehrere DAGs für aktiv-aktiv Websites und neue in Exchange 2013 unterstützte Methoden, z. B. das Auffinden eines FSW.
Dynamic Quorum schützt nicht vor einem doppelten Ausfall der Stromversorgung und der zugrunde liegenden unterbrechungsfreien Stromversorgung am selben Standort oder vor einem Verbindungsausfall zwischen den beiden Rechenzentren. Der Clusterdienst muss sauber heruntergefahren werden, um sicherzustellen, dass der Cluster und die DAG online bleiben.
Dynamic Quorum ist eine fantastische neue Funktion in Windows Server 2012, von der Exchange 2013 profitieren kann. Obwohl es nicht vor allen Fehlern schützt, ist es ein wichtiger Bestandteil Ihres Tool-Sets bei der Planung von Exchange 2013-Bereitstellungen und kann vor einer häufigen Ursache von DAG schützen Ausfälle.
Über den Autor:
Steve Goodman ist ein Exchange MVP und arbeitet als technischer Architekt für einen der führenden britischen Microsoft Gold-Partner, die Phoenix IT Group. Goodman ist seit 14 Jahren in der IT-Branche tätig und arbeitet seit Version 5.5 intensiv mit Microsoft Exchange zusammen.

Similar Posts

Leave a Reply