Sortieren der Datendeduplizierung in Windows Server 2012 R2

Die Deduplizierung ist in Windows Server 2012 und Windows Server 2012 R2 im Feld enthalten. Diese Technologie betrachtet ein Volume, findet Inhalte, die wiederholt werden, und entfernt alle bis auf eine Kopie dieses Inhalts – und ersetzt die Bereiche, die entfernt wurden, durch “Links” zurück zu der einzelnen Kopie des verbleibenden Teils.

Es ist eine sehr effektive Technik, um verfügbaren Speicherplatz von Volumes mit viel Inhalt zurückzugewinnen, der sich nicht wesentlich von anderen Inhalten unterscheidet. Denken Sie an ISO-Bibliotheken, Dateifreigaben mit vielen Versionen derselben Dateien (z. B. für das Revisions-Tracking) und an eine andere Anwendung, an die Sie möglicherweise nicht denken: VDI-Bereitstellungen. Diese virtuellen Maschinen, aus denen Ihre VDI-Bereitstellung besteht, enthalten nahezu exakte Kopien von Tausenden von Betriebssystembibliotheken und ausführbaren Dateien, selbst wenn Sie unterschiedliche Festplatten verwenden. Die Platzersparnis durch die Aktivierung der Deduplizierung bei einer VDI-Bereitstellung kann über 90% betragen, und andere Arten von Inhalten können Einsparungen von 50% oder mehr erzielen, ohne dass die Leistung spürbar beeinträchtigt wird. Und es ist in Ihrer Windows-Lizenz enthalten.

Windows Server 2012 R2 führt verschiedene Verbesserungen der Datendeduplizierungsfunktion ein, einschließlich der Möglichkeit, diese Funktion auf Scale-Out-Dateiservern und gemeinsam genutzten Cluster-Volumes einzurichten. Der Algorithmus in Windows Server 2012 R2 ist außerdem speziell für die Arbeit mit VHD- und VHDX-Dateien optimiert. Es wurde verbessert, wie effizient Windows auf die Festplatte schreibt und wie schnell der Optimierungsalgorithmus über eine Festplatte funktioniert, sodass aktive VHDX-Dateien in einer Produktionsbereitstellung einer virtuellen Desktop-Infrastruktur nicht unter Leistungsgesichtspunkten bestraft werden. Es ist wichtig zu beachten, dass sich der Hyper-V-Hostcomputer von dem Computer unterscheiden muss, auf dem sich die Speichervolumes befinden, auf denen die Deduplizierung aktiviert ist, da die Deduplizierung möglicherweise mehr Systemressourcen verbraucht, als Hyper-V bei einer aktiven Auslastung der virtuellen Maschine tolerieren kann.

Datendeduplizierungsjobs

Die Datendeduplizierung besteht aus drei Arten von Jobs, die in bestimmten Intervallen wiederholt werden:
Optimierungsjobs. Diese bilden den Kern der Analyse und der tatsächlichen Entfernung doppelter Inhalte von einem Volume. Diese Jobs führen auch eine Komprimierung für Dateiblöcke durch, die auf integrierten Algorithmen basieren, die die Endgröße der Datei mit den Auswirkungen des Dekomprimierungsprozesses auf die Leistung in Einklang bringen.
Datenbereinigungsjobs. Manchmal werden Daten während der Deduplizierung oder der anschließenden Komprimierung von Dateiblöcken eines Volumes beschädigt. Dies wird durch die Verwendung der Prüfsummenvalidierung und die Überprüfung der Konsistenz von Dateimetadaten überprüft. In diesem Fall versuchen Datenbereinigungsjobs, die Beschädigung zu beheben, indem sie entweder eine Kopie der Daten aus einer privaten Sicherung wiederherstellen, die Windows häufig für deduplizierten Inhalt bereitstellt, die Datei von einem fehlertoleranten Volume wie Windows Storage Spaces wiederherstellen oder die beschädigten ersetzen Chunk Midstream mit einem neuen, korrekten Chunk, während er geschrieben wird.
Speicherbereinigungsjobs. Diese Jobs nehmen die nicht optimierten oder nicht mehr benötigten Dateien auf und entfernen sie, um den verfügbaren Speicherplatz auf einem Volume zu erhöhen.

Aktivieren und Konfigurieren der Datendeduplizierung

Der einfachste Weg, um mit der Datendeduplizierung zu beginnen, besteht darin, die Funktion mit PowerShell dem Server hinzuzufügen, auf dem sie installiert werden soll. Sie können den Server-Manager über die GUI verwenden, es wird jedoch viel geklickt und ausgewählt. Die PowerShell-Methode umfasst nur drei Cmdlets, sodass deutlich weniger Arbeit erforderlich ist – etwas, für das ich sehr bin.
Öffnen Sie auf diesem Computer eine PowerShell-Befehlszeile mit Administratorrechten und geben Sie die folgenden Cmdlets ein:
Import-Module ServerManager
Add-WindowsFeature-Name FS-Daten-Deduplizierung
Deduplizierung des Importmoduls
Sobald die richtigen Softwarekomponenten installiert wurden, sind einige weitere PowerShell-Cmdlets erforderlich, um die Deduplizierung auf bestimmten Volumes zu aktivieren. Das folgende Cmdlet aktiviert beispielsweise Volume H: für die Datendeduplizierung für Bereitstellungszwecke der virtuellen Desktop-Infrastruktur (daher das UsageType-Flag als “HyperV”)
Enable-DedupVolume H: -UsageType HyperV
… Während das folgende Cmdlet regelmäßige Deduplizierungsbemühungen für Datenträger S ermöglicht.
Enable-DedupVolume S: -UsageType Standard
Sobald Sie diese Cmdlets ausgeführt und Ihre Volumes eingerichtet haben, wird der Optimierungsprozess standardmäßig stündlich ausgeführt und die Datenbereinigungs- und Speicherbereinigungsjobs werden einmal pro Woche ausgeführt. Sie können den Prozess bei Bedarf mit dem folgenden PowerShell-Cmdlet starten:
Start-DedupJob –Volumen S: –Typoptimierung
Sie können den von Windows automatisch eingerichteten Zeitplan mit dem folgenden Cmdlet überprüfen:
Get-DedupSchedule
Der Optimierungsjob kann von hier aus nur wöchentlich ausgeführt werden. Sie müssen eine benutzerdefinierte Aufgabe verwenden, die im Aufgabenplaner eingerichtet wurde, damit der Optimierungsjob häufiger ausgeführt wird.
Ich denke, in einer Zeit, in der wir ganze Kopien von Systemen in einer riesigen VHDX-Datei speichern und die Menge der von uns gespeicherten Daten weiter zunimmt, wird die Deduplizierung ein wichtiger Bestandteil der Verwaltung unseres verfügbaren Speichers und der Kontrolle der Kosten für die Speicherung unserer Daten sein . Da die Datendeduplizierung mit einer Windows Server-Lizenz im Lieferumfang enthalten ist, gibt es kaum einen Grund, sie heute nicht zu verwenden.

Similar Posts

Leave a Reply