New Blog

Dear reader,

To work more inline with my twitter activities and to open my blog for more interessting stuff (not just Veeam related), I am blogging only on the http://andyandthevms.com/ blog from now.

If I will write some updates at individual posts (e.g. Exchange Backup stuff) I will add an warning message with a link to the article on this blog.

So do not hesitate to check out my new blog under http://andyandthevms.com

Thanks for all the Feedback and support

Andy

Donnerstag, 22. Dezember 2011

Exchange DAG Cluster und VMware Snapshots - Problemlösung

Hallo ...
noch ein schnelles Update for Weihnachten.


In der Regel sind VMware Snapshots bei Exchange Servern kein Problem wenn der commit schnell geht.


Bei Exchange 2010 DAG-Cluster Systemen hingegen kann es vorkommen, dass der Heartbeat verloren geht und ein Clusterschwenk stattfindet. Dieses verhalten ist transparent für die Benutzer, die ganz normal weiterabeiten können. 


2 Mögliche Lösungen:


1.       Per Script nach dem Backup die Masterrollen der Datenbanken wieder verteilen wie gewünscht.


2.       Die Zeit hochsetzten, in der das Cluster merkt dass die Kommunikation verzögert ist.


Es gibt hierzu diverse Einträge bei VMware und Microsoft in den Foren und Whitepapers. Z.B.






Auch finden Sie einen Eintrag hierzu im Veeam Forum  (Auf Seite 2 mit den Lösungen).







Lösung 2 hat bei einem Kunden bisher ausgereicht.

Falls diese Lösung nicht hilft, gilt es den Snapshot Commit/Löschung schneller zu machen bzw. zu reparieren.

Bei einem VMware Snapshot Commit/Löschung werden alle Änderungen seit des Snapshot beginns in die eigentliche Datastoredatei geschrieben. Dies sind massive Random Writes.
Können diese Daten nicht schnell genug geschrieben werden, kommt es zu einem "Freeze" der virtuellen Maschine, die dann vom DAG und dessen Betriebssystem erkannt wird.

Zur Behebung dieses Phänomens gibt es diverse VMware Patches die eingespielt werden können. (Siehe VMware Knowledge Base).  Es kann aber auch am Storage liegen der hier zu hohe Latenzen aufweist wenn wir Random IOs schreiben. Hier habe ich im Feld schon erlebt, dass eine SAN Virtualisierung einen Firmwarebug hatte und nach dem Fix in Ordnung lief. Auch habe ich bei einem Kunden eine 5 Jahre alte Storage-System Firmware wiedergefunden die nach dem Update dann keine Probleme mehr machte. Falls hier Probleme da sind, über den VMware Support Analysieren lassen ob Patches eingespielt werden müssen oder es an der Hardware liegt.

Liebe Grüße Andreas Neufert

Keine Kommentare:

Kommentar veröffentlichen

Dieses Blog durchsuchen