Zoek op trefwoord, naam of systeem:

Blog

  • 14
    juli
    2017
    Joost van Blanken, Technology Professional

    Data Deduplication

    Bij één van mijn opdrachtgevers liepen we onlangs tegen het probleem aan dat onze gebruikers geen data meer konden wegschrijven op de schijven van de FileServer. Na een kleine inspectie bleek dit ook logisch: er was amper nog ruimte over om ook maar iets op te slaan. Omdat het datacenter van de opdrachtgever ondergebracht is bij een hostingpartij, konden we (helaas) niet zo snel schakelen dat we meteen voor een fysieke schijfuitbreiding konden kiezen.

    Een snelle opschoonactie bleek de enige actie die we konden toepassen. Helaas leverde dit maar enkele GB’s aan vrije ruimte op. Je begrijpt dat dit op de korte termijn een prima oplossing is, maar om permanent meer schijfruimte beschikbaar te maken zonder schijfuitbreiding hebben we besloten om hier een build-in functionaliteit van Windows server 2012 te gaan gebruiken: File Deduplication.

    Wat is Deduplication?

    Data deduplicatie is geïntroduceerd in Windows Server 2012. Deduplicatie is een techniek waarbij het OS op zoek gaat naar dubbele data en deze dubbeling verwijdert, zonder dat hiervan de betrouwbaarheid of integriteit wordt aangepast. Deze techniek kan op vele onderdelen/functionaliteiten worden toegepast, denk hierbij aan Fileservers, Deployment Shares, VDI, back-up, etc.

    Het doel van deze toepassing is om meer data op te slaan op minder ruimte door het opzoeken van dubbele datablokken en het onderhouden van één exemplaar. Dubbele blokken worden verwijderd en vervangen door een verwijzing naar een eerder (origineel) exemplaar.


    Mogelijke besparing op verschillende type data

    In deze blog laat ik je zien hoe je deze toepassing installeert en configureert.

    Installatie

    Open de “Add Rolls and Features” vanuit de Server Manager.
    Laat de default staan op “Role Based …” en klik op Next.
    Select de server waarop je de rol wilt installeren
    Klik op ‘File and Storage Services’, klik op ‘File and iSCSI Services’, zet vervolgens een vinkje bij ‘Data Deduplication’.
    Bij Features hoeft je niets te installeren, klik op Next.
    Klik vervolgens op Install.
    Nadat de installatie is voltooid klik op Close om de installatie af te ronden.

    Nu deduplicatie geïnstalleerd is op de FileServer kunnen we de configuratie gaan doen.

    Configuratie

    Open de Server Manager en ga naar ‘File and Storage Services’.
    Klik daarna op het volume waar je de deduplication op plaats wilt laten vinden. (Het OS volume is niet beschikbaar voor deduplication)
    Rechtermuisklik op het volume waar je de deduplication wilt laten plaatsvinden en selecteer ‘Configure Data Deduplication’.
    In dit venster kun je aangeven welk type dedupliction je wilt laten toepassen.

    Tevens kun je aangeven wanneer de deduplication gaat starten (files ouder dan x dagen).

    Ook is er de mogelijkheid om zowel bepaalde extensies als folders te ontsluiten van de deduplication.

    En als laatste optie kun je de deduplication ook plannen in een uitgebreid schema.

    In dit voorbeeld laat ik zien wat het effect is van deduplication op een volume van 50 GB. De inhoud van de data varieert grotendeels van elkaar. In een grotere productieomgeving is het aanbod van files groter, maar ik laat dit zien puur ter demonstratie.

    Na het configureren van de deduplication zal dit niet direct starten. Om dit handmatig te starten kun je de volgende commando’s in PowerShell starten:

    Starten van deduplication:
    Start-DedupJob –Volume E: –Type Optimization

    Status opvragen:
    Get-Dedupstatus

    Het uiteindelijke resultaat is ook op te vragen in de Server Manager

    Zoals je ziet is er een behoorlijke winst geboekt. In dit voorbeeld is er maar liefst 79% aan ruimte terug gewonnen. Niet alleen bij de directe opslag is er ruimte gewonnen maar dit zal ook doorwerken in de back-up.

    Wat mij is opgevallen bij deze toepassing is dat er op korte termijn veel ruimte gewonnen kan worden. Ook de mogelijkheid tot het buitensluiten van diverse folders vind ik een pluspunt. Op deze manier kan er ook gekeken worden naar een andere oplossing als bijvoorbeeld het hardware matig uitbreiden van disk capaciteit.

Trefwoorden: Microsoft

Email Joost van Blanken

Lees alle blogberichten van Joost van Blanken

Deel dit bericht

Geen reacties

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *