Sieben wichtige Informationen zur Windows Server 2012-Deduplizierung

Sprechen Sie mit den meisten Administratoren über die Deduplizierung. Die übliche Antwort lautet: Warum? Der Speicherplatz wird immer billiger …

die Zeit, in der die E / A-Geschwindigkeiten mit ansteigen. Die Diskussion endet dort oft mit einem Achselzucken.
Das Problem ist jedoch nicht, wie viel Sie speichern oder wie schnell Sie darauf zugreifen können. Das Problem ist, ob die Speicherverbesserungen pro Gigabyte oder I / O. Die Durchsätze werden durch die in Ihrer Organisation gespeicherte Datenmenge übertroffen. Je mehr wir speichern können, desto mehr speichern wir. Und während Deduplizierung ist kein Wundermittel, sondern eine von vielen Strategien, mit denen sich die Anforderungen an die Datenspeicherung verringern lassen.
Microsoft hat in Windows Server 2012 eine Deduplizierungssubsystemfunktion hinzugefügt, mit der die Deduplizierung für alle Volumes durchgeführt werden kann, die von einer bestimmten Instanz von Windows Server verwaltet werden. Anstatt die Deduplizierungspflicht auf eine Hardware- oder Softwareschicht zu verlagern, erfolgt dies im Betriebssystem sowohl auf Block- als auch auf Dateiebene. Dies bedeutet, dass viele Arten von Daten (z. B. mehrere Instanzen einer virtuellen Maschine) erfolgreich dedupliziert werden können minimaler Overhead.
Wenn Sie die Windows Server 2012-Deduplizierungstechnologie implementieren möchten, stellen Sie sicher, dass Sie diese sieben Punkte verstehen:

1. Die Deduplizierung ist standardmäßig nicht aktiviert

Tu es nicht Aktualisieren Sie auf Windows Server 2012 und erwarten Sie, dass automatisch Platzersparnisse angezeigt werden. Die Deduplizierung wird als Datei- und Speicherdienstfunktion und nicht als Kernkomponente des Betriebssystems behandelt. Zu diesem Zweck müssen Sie es aktivieren und manuell konfigurieren Serverrollen | Datei und Speicher Dienstleistungen | Datei- und iSCSI-Dienste. Nach der Aktivierung muss es auch volumenweise konfiguriert werden.

2. Die Deduplizierung belastet das System nicht

Microsoft hat viel darüber nachgedacht, die Deduplizierung so einzurichten, dass sie nur einen geringen Systembedarf hat und auch auf Servern mit hoher Auslastung ausgeführt werden kann. Hier sind drei Gründe warum:
ein. Der Inhalt wird erst danach dedupliziert n Anzahl der Tage mit n Standardmäßig 5, dies kann jedoch vom Benutzer konfiguriert werden. Diese Zeitverzögerung verhindert, dass der Deduplikator versucht, Inhalte zu verarbeiten, die derzeit und aggressiv verwendet werden, oder Dateien zu verarbeiten, während sie auf die Festplatte geschrieben werden (was einen großen Leistungseinbruch darstellen würde).
b. Die Deduplizierung kann durch das Verzeichnis oder den Dateityp eingeschränkt werden. Wenn Sie bestimmte Arten von Dateien oder Ordnern von der Deduplizierung ausschließen möchten, können Sie diese ebenfalls angeben.
c. Der Deduplizierungsprozess ist selbstdrosselnd und kann mit unterschiedlichen Prioritätsstufen ausgeführt werden. Sie können festlegen, dass der eigentliche Deduplizierungsprozess mit niedriger Priorität ausgeführt wird. Er wird automatisch angehalten, wenn das System stark ausgelastet ist. Sie können auch ein Zeitfenster festlegen, in dem der Deduplikator beispielsweise außerhalb der Geschäftszeiten mit voller Geschwindigkeit ausgeführt werden soll.
Auf diese Weise kann mit ein wenig Verwaltungsaufwand die Deduplizierung auch auf einem ausgelasteten Server durchgeführt werden, ohne die Leistung zu beeinträchtigen.

3. Deduplizierte Volumes sind “atomare Einheiten”.

“Atomic Units” bedeutet, dass alle Deduplizierungsinformationen zu einem bestimmten Volume auf diesem Volume gespeichert bleiben, sodass sie ohne Verletzung auf ein anderes System verschoben werden können, das die Deduplizierung unterstützt. Wenn Sie es auf ein System ohne Deduplizierung verschieben, werden nur die nicht duplizierten Dateien angezeigt. Die beste Regel ist, ein dedupliziertes Volume nur auf einen anderen Windows Server 2012-Computer zu verschieben.

4. Die Deduplizierung funktioniert mit BranchCache

Wenn auf einem Zweigstellenserver auch Deduplizierung ausgeführt wird, werden Daten zu dedupierten Dateien mit dem zentralen Server geteilt, wodurch die Datenmenge verringert wird, die zwischen den beiden gesendet werden muss.

5. Das Sichern deduplizierter Volumes kann schwierig sein

EIN blockbasiert Backup-Lösung – z. B. a Disk-Image-Backup Methode – sollte unverändert funktionieren und alle Deduplizierungsdaten beibehalten.
Dateibasierte Sicherungen funktionieren ebenfalls, sie behalten jedoch keine Deduplizierungsdaten bei, es sei denn, sie sind deduplizierungsfähig. Sie sichern alles in seiner ursprünglichen, diskreten, nicht duplizierten Form. Darüber hinaus bedeutet dies, dass Sicherungsmedien groß genug sein sollten, um auch die nicht duplizierten Daten aufzunehmen.
Die native Windows Server-Sicherungslösung ist deduplizierungsfähig. Sicherungsprodukte von Drittanbietern für Windows Server 2012 sollten jedoch überprüft werden, um festzustellen, ob die Deduplizierungserkennung vorhanden ist oder in einer zukünftigen Version hinzugefügt wird.

6. Mehr ist besser, wenn es um Kerne und Speicher geht

Microsoft empfiehlt, mindestens einen CPU-Kern und 350 MB freien Speicher für die Verarbeitung von jeweils einem Volume mit etwa 100 zu verwenden GB Lagerung in einer Stunde (ohne Unterbrechungen) oder ca. 2 verarbeitet TB ein Tag. Je mehr Parallelität Sie sparen müssen, desto mehr Volumes können Sie gleichzeitig verarbeiten.

7. Der Kilometerstand bei der Deduplizierung kann variieren

Microsoft hat knirschte seine eigenen Zahlen und stellte fest, dass die Art der Bereitstellung die Höhe der Platzersparnis beeinflusste. Mehrere Betriebssysteminstanzen aktiviert virtuelle Festplatten (VHDs) zeigten aufgrund der Menge an redundantem Material zwischen ihnen erhebliche Einsparungen. Benutzerordner, weniger.
In seiner Übersicht über die guten und schlechten Kandidaten für die Deduplizierung Microsoft-Notizen dass Live-Exchange Server-Datenbanken tatsächlich schlechte Kandidaten sind. Das klingt nicht intuitiv. Sie würden denken, dass eine Exchange-Postfachdatenbank möglicherweise viele redundante Daten enthält. Die sich ständig ändernde Art der Daten (Nachrichten, die verschoben, gelöscht, erstellt usw. werden) gleicht jedoch die durch Deduplizierung erzielten Einsparungen bei Durchsatz und Speicherplatz aus. Ein Exchange Server-Sicherungsvolume ist jedoch ein besserer Kandidat, da es sich seltener ändert und dedupliziert werden kann, ohne die Dinge sichtbar zu verlangsamen.
Wie viel Sie tatsächlich durch Deduplizierung in Ihrer speziellen Einstellung erhalten, ist der eigentliche Test für die Verwendung. Daher ist es am besten, vorläufig zu beginnen, möglicherweise auf einem Staging-Server, auf dem Sie die “Crawling-Rate” für die Deduplizierung so hoch wie nötig einstellen können, um zu sehen, wie viel Platz Sie mit Ihren Daten sparen, und dann einen Zeitplan für die Durchführung der Deduplizierung selbst erstellen können Live-Server.
Über den Autor
Serdar Yegulalp schreibt seit mehr als 15 Jahren für eine Vielzahl von Publikationen über Computer und Informationstechnologie, darunter InformationWeek und Windows Magazine. Schauen Sie sich seinen Blog unter an GenjiPress.com.

Similar Posts

Leave a Reply