Delen via


Gegevensontdubbeling installeren en inschakelen

In dit onderwerp wordt uitgelegd hoe u Gegevensontdubbeling installeert, workloads evalueert voor ontdubbeling en gegevensontdubbeling inschakelt op specifieke volumes.

Note

Als u van plan bent om gegevensontdubbeling uit te voeren in een failovercluster, moet voor elk knooppunt in het cluster de serverfunctie voor gegevensontdubbeling zijn geïnstalleerd.

Gegevensontdubbeling installeren

Important

KB4025334 bevat een samengeteld aantal oplossingen voor gegevensontdubbeling, inclusief belangrijke betrouwbaarheidscorrecties, en we raden u ten zeerste aan deze te installeren bij het gebruik van gegevensontdubbeling met Windows Server 2016.

Gegevensontdubbeling installeren met Serverbeheer

  1. Selecteer serverfuncties in de wizard Functies en onderdelen toevoegen en selecteer vervolgens Gegevensontdubbeling. Gegevensontdubbeling installeren via Serverbeheer: gegevensontdubbeling selecteren vanuit serverfuncties
  2. Klik op Volgende totdat de knop Installeren actief is en klik vervolgens op Installeren. Gegevensontdubbeling installeren via Serverbeheer: klik op Installeren

Gegevensontdubbeling installeren met behulp van PowerShell

Als u Gegevensontdubbeling wilt installeren, voert u de volgende PowerShell-opdracht uit als beheerder: Install-WindowsFeature -Name FS-Data-Deduplication

Gegevensontdubbeling installeren:

  • Installeer vanaf een server met Windows Server 2016 of hoger, of vanaf een Windows-pc waarop RSAT ( Remote Server Administration Tools ) is geïnstalleerd, gegevensontdubbeling met een expliciete verwijzing naar de servernaam (vervang 'MyServer' door de echte naam van het serverexemplaar):

    Install-WindowsFeature -ComputerName <MyServer> -Name FS-Data-Deduplication
    

    Or

  • Maak extern verbinding met de serverinstantie met PowerShell remoting en installeer gegevensontdubbeling met behulp van DISM.

    Enter-PSSession -ComputerName MyServer
    dism /online /enable-feature /featurename:dedup-core /all
    

Gegevensontdubbeling inschakelen

Bepalen welke workloads kandidaten zijn voor gegevensontdubbeling

Gegevensontdubbeling kan de kosten van het gegevensverbruik van een servertoepassing effectief minimaliseren door de hoeveelheid schijfruimte te verminderen die wordt verbruikt door redundante gegevens. Voordat u ontdubbeling inschakelt, is het belangrijk dat u de kenmerken van uw workload begrijpt om ervoor te zorgen dat u de maximale prestaties van uw opslag krijgt. Er zijn twee categorieën workloads die u moet overwegen.

  • Aanbevolen werkbelastingen die beide gegevenssets hebben bewezen die zeer profiteren van ontdubbeling en resourceverbruikspatronen hebben die compatibel zijn met het postverwerkingsmodel van Gegevensontdubbeling. U wordt aangeraden gegevensontdubbeling altijd in te schakelen voor deze werkbelastingen:
    • Algemene bestandsservers (GPFS) die shares leveren, zoals teamshares, gebruikersmappen, werkmappen en softwareontwikkelingsshares.
    • Gevirtualiseerde VDI-servers (Virtualized Desktop Infrastructure).
    • Gevirtualiseerde back-uptoepassingen, zoals Microsoft Data Protection Manager (DPM).
  • Workloads die kunnen profiteren van ontdubbeling, maar die niet altijd goede kandidaten zijn voor ontdubbeling. De volgende werkbelastingen kunnen bijvoorbeeld goed werken met ontdubbeling, maar u moet eerst de voordelen van ontdubbeling evalueren:
    • Algemene doeleinden Hyper-V hosts
    • SQL-servers
    • Servers voor bedrijfsapplicaties (Line-of-business)

Workloads evalueren voor gegevensontdubbeling

Important

Als u een aanbevolen workload uitvoert, kunt u deze sectie overslaan en naar Gegevensontdubbeling inschakelen voor uw workload gaan.

Beantwoord de volgende vragen om te bepalen of een werkbelasting goed werkt met ontdubbeling. Als u niet zeker weet hoe een workload werkt, kunt u overwegen om een testimplementatie van gegevensontdubbeling uit te voeren voor een testgegevensset voor uw workload om te zien hoe deze presteert.

  1. Heeft de gegevensset van mijn workload voldoende duplicatie om te profiteren van het inschakelen van ontdubbeling? Voordat u Gegevensontdubbeling inschakelt voor een workload, moet u onderzoeken hoeveel duplicatie de gegevensset van uw workload heeft met behulp van het hulpprogramma Gegevensontdubbelingsbesparingsevaluatie of DDPEval. Nadat u Gegevensontdubbeling hebt geïnstalleerd, kunt u dit hulpprogramma vinden op C:\Windows\System32\DDPEval.exe. DDPEval kan het potentieel voor optimalisatie evalueren voor direct verbonden volumes (inclusief lokale schijven of gedeelde clustervolumes) en toegewezen of niet-toegewezen netwerkschijven.

    Als u DDPEval.exe uitvoert, wordt een uitvoer geretourneerd die er ongeveer als volgt uitziet:

     Data Deduplication Savings Evaluation Tool
     Copyright 2011-2012 Microsoft Corporation.  All Rights Reserved.
    
     Evaluated folder: E:\Test
     Processed files: 34
     Processed files size: 12.03MB
     Optimized files size: 4.02MB
     Space savings: 8.01MB
     Space savings percent: 66
     Optimized files size (no compression): 11.47MB
     Space savings (no compression): 571.53KB
     Space savings percent (no compression): 4
     Files with duplication: 2
     Files excluded by policy: 20
     Files excluded by error: 0
    
  2. Hoe zien de I/O-patronen van mijn workload eruit ten opzichte van zijn dataset? Welke prestatie heb ik voor mijn werklast? Gegevensontdubbeling optimaliseert bestanden als een periodieke taak in plaats van wanneer het bestand naar de schijf wordt geschreven. Als gevolg hiervan is het belangrijk om te onderzoeken wat de verwachte leespatronen van een workload zijn voor het ontdubbelde volume. Omdat deduplicatie bestandsinhoud naar het segmentarchief verplaatst en zoveel mogelijk probeert het segmentarchief op bestand te organiseren, presteren leesbewerkingen het beste wanneer ze worden toegepast op opeenvolgende delen van een bestand.

    Databaseachtige workloads hebben doorgaans meer willekeurige leespatronen dan sequentiële leespatronen, omdat databases doorgaans niet garanderen dat de database-indeling optimaal is voor alle mogelijke query's die kunnen worden uitgevoerd. Omdat de secties van de Chunk Store mogelijk overal in het volume te vinden zijn, kan het benaderen van gegevensbereiken in de Chunk Store voor databasequery's tot extra latentie leiden. Workloads met hoge prestaties zijn bijzonder gevoelig voor deze extra latentie, maar andere databaseachtige workloads zijn mogelijk niet.

    Note

    Deze problemen zijn voornamelijk van toepassing op opslagworkloads op volumes die bestaan uit traditionele rotatieopslagmedia (ook wel harde schijven of HDD's genoemd). All-flash-opslaginfrastructuur (ook wel Solid State Disk-stations of SSD's genoemd), wordt minder beïnvloed door willekeurige I/O-patronen omdat een van de eigenschappen van flashmedia gelijke toegangstijd heeft tot alle locaties op de media. Daarom introduceert ontdubbeling niet dezelfde hoeveelheid latentie voor leesbewerkingen naar de gegevenssets van een workload die zijn opgeslagen op all-flashmedia, zoals op traditionele rotatieopslagmedia.

  3. Wat zijn de resourcevereisten van mijn workload op de server? Omdat gegevensontdubbeling gebruikmaakt van een postverwerkingsmodel, moet gegevensontdubbeling periodiek voldoende systeembronnen hebben om de optimalisatie en andere taken te voltooien. Dit betekent dat workloads die inactieve perioden hebben, zoals 's avonds of in het weekend, uitstekende kandidaten zijn voor ontdubbeling en dat workloads die de hele dag, elke dag worden uitgevoerd, dat mogelijk niet zijn. Workloads die geen niet-actieve tijd hebben, kunnen nog steeds goede kandidaten zijn voor ontdubbeling als de workload geen hoge resourcevereisten op de server heeft.

Gegevensontdubbeling inschakelen

Voordat u gegevensontdubbeling inschakelt, moet u het gebruikstype kiezen dat het meest lijkt op uw werkbelasting. Er zijn drie gebruikstypen opgenomen in Gegevensontdubbeling.

  • Standaard - specifiek afgestemd op bestandsservers voor algemeen gebruik
  • Hyper-V - specifiek afgestemd op VDI-servers
  • Back-up : specifiek afgestemd op gevirtualiseerde back-uptoepassingen, zoals Microsoft DPM

Gegevensontdubbeling inschakelen met Serverbeheer

  1. Selecteer Bestands- en opslagservices in Serverbeheer. Klik op Bestands- en opslagservices
  2. Selecteer Volumes in Bestands- en opslagservices. Klik op Volumes
  3. Klik met de rechtermuisknop op het gewenste volume en selecteer Gegevensontdubbeling configureren. Klik op Gegevensontdubbeling configureren
  4. Selecteer het gewenste gebruikstype in de vervolgkeuzelijst en selecteer OK. Selecteer het gewenste gebruikstype in de vervolgkeuzelijst
  5. Als u een aanbevolen workload uitvoert, bent u klaar. Zie Andere overwegingen voor andere workloads.

Note

Meer informatie over het uitsluiten van bestandsextensies of mappen en het selecteren van het ontdubbelingsschema, waaronder waarom u dit wilt doen, vindt u in Het configureren van gegevensontdubbeling.

Gegevensontdubbeling inschakelen met behulp van PowerShell

  1. Voer met een beheerderscontext de volgende PowerShell-opdracht uit:

     Enable-DedupVolume -Volume <Volume-Path> -UsageType <Selected-Usage-Type>
    
  2. Als u een aanbevolen workload uitvoert, bent u klaar. Zie Andere overwegingen voor andere workloads.

Note

De PowerShell-cmdlets voor gegevensontdubbeling, waaronder Enable-DedupVolume, kunnen extern worden uitgevoerd door de -CimSession parameter toe te voegen aan een CIM-sessie. Dit is met name handig voor het extern uitvoeren van de PowerShell-cmdlets voor gegevensontdubbeling op een serverinstantie. Voer de opdracht uit om een nieuwe CIM-sessie te maken New-CimSession.

Andere overwegingen

Important

Als u een aanbevolen workload uitvoert, kunt u deze sectie overslaan.

Veelgestelde vragen (FAQ)

Ik wil Gegevensontdubbeling uitvoeren op de gegevensset voor X-werkbelasting. Wordt dit ondersteund? Afgezien van workloads die niet samenwerken met Gegevensontdubbeling, ondersteunen we de gegevensintegriteit van Gegevensontdubbeling met elke workload volledig. Aanbevolen werkbelastingen worden ook ondersteund door Microsoft voor prestaties. De prestaties van andere workloads zijn sterk afhankelijk van wat ze doen op uw server. U moet bepalen welke invloed gegevensontdubbeling heeft op uw workload en of dit acceptabel is voor deze workload.

Wat zijn de volumegroottevereisten voor ontdubbelde volumes? In Windows Server 2012 en Windows Server 2012 R2 moesten volumes nauwkeurig worden bepaald om ervoor te zorgen dat gegevensdeduplicatie de wijzigingen op het volume kon bijhouden. Dit betekende doorgaans dat de gemiddelde maximale grootte van een gededupliceerd volume voor een workload met een hoog churn 1-2 TB was en dat de absolute maximale aanbevolen grootte 10 TB was. In Windows Server 2016 zijn deze beperkingen verwijderd. Zie Wat is er nieuw in Gegevensontdubbeling voor meer informatie.

Moet ik de planning of andere instellingen voor gegevensontdubbeling wijzigen voor aanbevolen werkbelastingen? Nee, de opgegeven gebruikstypen zijn gemaakt om redelijke standaardwaarden te bieden voor aanbevolen werkbelastingen.

Wat zijn de geheugenvereisten voor gegevensontdubbeling? Gegevensontdubbeling moet minimaal 300 MB + 50 MB hebben voor elke TB aan logische gegevens. Als u bijvoorbeeld een volume van 10 TB optimaliseert, hebt u minimaal 800 MB geheugen nodig dat is toegewezen voor ontdubbeling (300 MB + 50 MB * 10 = 300 MB + 500 MB = 800 MB). Hoewel gegevensontdubbeling een volume met deze lage hoeveelheid geheugen kan optimaliseren, worden de taken van gegevensontdubbeling vertraagd wanneer dergelijke beperkte resources worden gebruikt.

Gegevensontdubbeling moet optimaal 1 GB geheugen hebben voor elke 1 TB aan logische gegevens. Als u bijvoorbeeld een volume van 10 TB optimaliseert, hebt u optimaal 10 GB geheugen nodig dat is toegewezen voor gegevensontdubbeling (1 GB * 10). Deze verhouding zorgt voor de maximale prestaties voor gegevensontdubbelingstaken.

Wat zijn de opslagvereisten voor gegevensontdubbeling? In Windows Server 2016 kan gegevensontdubbeling volumegrootten tot 64 TB ondersteunen. Bekijk wat er nieuw is in Gegevensontdubbeling voor meer informatie.