Betrouwbaarheid terabyte schijven NAS bij thuis gebruik

Marco den Teuling
1

Ook een goedkope NAS kun je thuis voorzien van harde schijven voor tientallen terabytes aan RAID-opslagruimte. Dat kan problemen geven. De opslag en vooral het herstellen van je persoonlijke documenten, zoals foto’s van familie en vakantie en home-videos, kan lastig en tijdrovend zijn. Maar dit kun je vermijden met een passende configuratie, het juiste onderhoud en een slimme keuze van schijven.


Terabyte schijven NAS RAID


Particuliere gebruikers en kleine kantoren

Harde schijven blijven groeien – niet de buitenmaten, waar het 3,5-inch formaat populair blijft, maar in termen van opslagcapaciteit. Schijven met 18 TB zijn in de detailhandel verkrijgbaar voor minder dan 400 euro en modellen met 20 TB worden binnenkort verwacht. Seagate heeft er onlangs een gepresenteerd.

Opslagsystemen met de kenmerken genoemd in het artikel -Betrouwbaarheid multi-terabyte schijven Betrouwbaarheid multi-terabyte schijven zijn niet alleen te duur, groot, energieverslindend en lawaaierig voor particuliere huishoudens, ze zijn ook vooral ontworpen voor datacenters met airconditioning en een redundante en fail-safe voedingssysteem.

De verschillen bij thuis gebruik Terabyte schijven NAS

Omgekeerd laat de beschrijving van de professionele systemen zien welke functies en hulpmiddelen ontbreken bij compacte NAS-systemen en bestandsservers voor particuliere gebruikers en kleine kantoren. Derge­lijke apparaten zijn ontworpen voor vijf tot 25 gelijk­tijdige gebruikers en hebben twee of vier cpu-kernen, 1 tot 8 GB aan RAM en één of twee gigabit-ethernet­poorten (of 2,5GBase-T).

Een thuis-NAS brengt het grootste deel inactief door, en werkt idealiter energie­zuinig en stil. Het RAID-beheer moet zo eenvoudig mogelijk zijn en zal vaak automatisch uitgevoerd worden. Gezien de bescheiden middelen van compacte NAS-­systemen is het duidelijk dat je hun grenzen opzoekt als je ze niets­vermoedend volpropt met de dikste schijven.

Kies een van deze opties voor het inrichten van NAS Terabyte schijven thuis

Daarom is het raadzaam een van de volgende twee opties te kiezen bij het inrichten van een NAS:

  1. Als je een kleine NAS met een zeer grote capaciteit wilt, moet je jezelf vertrouwd maken met de technologie, zorgvuldig plannen en alle risico’s incalculeren.
  2. Als je daarentegen niet dieper in de materie wilt duiken, ga dan uit van het KISS-principe: Keep It Simple, Stupid. Met een RAID 1 bestaande uit twee schijven van elk maximaal 6 of 8 TB neem je geen groot risico, mits je de juiste schijven aanschaft en voor back-ups zorgt.

Hoe minder schijven moeten samenwerken in een NAS, des te beter. Dan zijn er minder verbindingen, is er minder energieverbruik en dus ook minder warmte en trillingen. Harde schijven zijn gevoelig voor dat laatste, en dus ook voor trillingen die door andere schijven in dezelfde NAS worden veroorzaakt.

RAID 1 betrouwbaarder dan RAID-5

Als een RAID 1-array van twee schijven voldoende capaciteit kan bieden, is dat in principe een betrouwbaardere keuze dan RAID 5, die uit minstens drie schijven bestaat. Het is ook makke­lijker om gegevens te herstellen van een enkele schijf van een defecte RAID 1 dan van een RAID 5-array.


Terabyte schijven NAS thuis


Dat kan indien nodig zelfs op een andere (Linux-)computer als de NAS-hardware defect raakt en er geen vervanging voor het oude apparaat beschikbaar is. Het kan zelfs een optie zijn om slechts met één schijf te werken en te vertrouwen op frequente back-ups in plaats van RAID.


Terabyte schijven NAS thuis


Schijven kiezen voor je NAS

In principe kun je een NAS voorzien van elke schijf. Maar het is raadzaam om rekening te houden met de compatibiliteitslijsten van de NAS-fabrikant en aan de hand daarvan schijven te kiezen die zijn ontworpen voor jouw NAS.

De verschillende harde schijven

De drie nog resterende fabrikanten van harde schijven, Seagate, Toshiba en Western Digital (WD), produceren speciale NAS-schijven. Voor een ‘kleine’ NAS met acht bays zijn dat de Seagate Ironwolf, Toshiba NAS Systems en WD Red Plus-series. Voor grotere NAS-systemen zijn dat de Ironwolf Pro, WD Red Pro, en Toshiba Enterprise Capacity-series, en recentelijk Synology-schijven.

NAS-schijven verschillen op meerdere punten van desktopschijven. De eerste zijn ontworpen voor continu gebruik, terwijl sommige bijzonder zuinig zijn en minder trillen. De garantietermijnen beslaan meestal drie of vijf jaar in plaats van twee.

Dataoverdrachtcapaciteit

Ze hebben een grotere jaarlijkse dataoverdrachtcapaciteit, zoals 180 TB in plaats van slechts 55 TB. Dat betekent niet dat desktopschijven ophouden te werken na 55 TB, maar dat ze zijn ontworpen voor een lager gemiddeld gebruik, bijvoorbeeld 2400 werkuren per jaar (240 werkdagen van elk 10 uur).

Een ruwe berekening daarbij: als je 200 GB (0,2 TB) leest of schrijft van of naar een NAS op elk van de 240 werkdagen per jaar – wat ongeveer een half uur zou ­duren met 1 Gbit/s ethernet – is dat 46 TB over het hele jaar. Voeg daarbij de maandelijkse scrubbing (zie kader), en je hebt nog eens 96 TB per jaar bij 8TB-schijven, voor een totale werkbelasting van 142 TB.

NAS-schijven minder trillingen

NAS-schijven zijn ontworpen om meer trillingen te weerstaan dan desktopschijven. De gebruikelijke aanbeveling bij goedkope NAS-schijven is een maximum van acht schijven in hetzelfde systeem. Alleen de duurdere enterpriseschijven hebben sensors om trillingen te detecteren en actief te compenseren.


Blijf op de hoogte van de nieuwste informatie en tips!
Schrijf je in voor de nieuwsbrief:

Ontvang elke week het laatste IT-nieuws, de handigste tips en speciale aanbiedingen.


Die duurdere schijven hebben doorgaans ook een hogere werk­belasting. Sommige draaien ook sneller voor een hogere gegevens­overdracht, maar hebben dan zwaardere koeling nodig en verbruiken meer energie.

Firmware van NAS-schijven – TLER

Firmware van NAS-schijven heeft gewoonlijk een functie genaamd Time-Limited Error Recovery (TLER), Error Recovery Control (ERC) of Command Completion Time Limit (CCTL). Dat betekent dat bij een leesfout de schijfcontroller slechts gedurende een beperkte tijd zal proberen de gegevens in die sector te herstellen door ze opnieuw te lezen. In plaats daarvan meldt hij dan gewoon dat de data weg is en leest de RAID-controller de sector van een andere schijf.

TLER wordt verondersteld RAID-problemen te voorkomen: als een schijf zonder TLER te lang niet reageert, dan classificeert de RAID-controller de schijf als defect en schopt die uit de array. Alle redundantie is dan verloren totdat de schijf is vervangen en een rebuild voltooid is (zie kader).

Voor schijven met TLER blijft de array intact en wordt op zijn laatst bij de volgende scrubbing de redundantie van de defecte sector hersteld.

Indien slechts een enkele schijf aanwezig is, lijkt TLER op het eerste gezicht juist tot dataverlies te kunnen leiden. Leesfouten komen bij gezonde harde schijven echter zo zelden voor dat we geen concrete gegevens kennen over hoe vaak TLER tot dataverlies leidt.

Shingled Magnetic Recording SMR-probleem

De opnametechnologie Shingled Magnetic Recording (SMR) die sinds enkele jaren wordt gebruikt, verhoogt de capaciteit van harde schijven, maar kan de RAID-reconstructie verstoren. Daarom is het beter om een thuis-NAS uit te rusten met harde schijven met Conventional Magnetic Recording (CMR). Wanneer erg lang naar SMR-schijven wordt geschreven, kan het gebeuren dat die een tijd lang niet reageren als de toegangspatronen ongunstig zijn. De RAID-controller classificeert de schijven dan als defect. Als dat gebeurt tijdens een RAID-­rebuild, bestaat er zelfs een risico op dataverlies.



Verschillen SMR en CMR

Bij puur sequentieel schrijven van eerder ongebruikte datatracks is er theoretisch geen verschil tussen SMR en CMR. Maar om tracks gedeeltelijk te kunnen overschrijven, moet een SMR-schijf eerst een bepaalde hoeveelheid oude gegevens inlezen, de nieuwe gegevens toevoegen en het resultaat in één keer wegschrijven.

De reden daarvoor is dat de schrijfkop bij SMR-schijven breder is dan de voltooide datatrack, zodat hij een voldoende sterk magnetisch veld voor het schrijven kan genereren. De leeskop is op zijn beurt smaller. De schrijfkop schrijft de tracks dus gedeeltelijk overlappend. De term shingled verwijst naar de typische opstelling van shingles, oftewel dakpannen. Aangezien de resulterende tracks smaller zijn, passen er meer op de schijf. De capa­citeit neemt daardoor toe.

CMR-gebieden als buffer op SMR

Om het ‘overschrijfprobleem’ op te lossen, zijn er extra CMR-gebieden met enkele gigabytes capaciteit beschikbaar op de magnetische schijven (platters) van SMR-schijven. Die CMR-gebieden worden tijdens het schrijven als buffers gevuld. Tijdens pauzes, wanneer er geen verdere toegang meer is, schrijft de schijf de gebufferde gegevens dan naar de SMR-sporen.

Maar als een RAID-rebuild urenlang zonder onderbreking gegevens schrijft, faalt dat cacheconcept. Een oplossing daarvoor zouden SMR-schijven zonder eigen SMR-beheer kunnen zijn, maar die kun je alleen gebruiken met speciale opslagsoftware voor host-managed SMR. Dropbox doet dit bijvoorbeeld in zijn eigen Object Storage-systemen.

Heliumvulling

Sommige NAS-bezitters wantrouwen daarnaast harde schijven met heliumvulling omdat die ­technologie als onvolwassen wordt beschouwd. Voor zover wij weten is dat echter ongegrond. He-schijven zijn juist iets zuiniger en doorgaans betrouwbaarder. Ze zijn al ongeveer acht jaar op de markt – dat is langer dan de typische productieve gebruiksperiode, waarbij je opnieuw de garantieperiode van de fabrikant als richtlijn kunt nemen. Over garantie gesproken: let er bij de aankoop op dat je geen OEM- of bulkschijven te pakken krijgt met alleen de wettelijke garantie, maar producten voor de detailhandel met een volledige fabrieksgarantie. Helaas kun je dat pas na aankoop controleren aan de hand van de serienummers.

Configureren en scrubbing

De betrouwbaarheid van een RAID-array hangt ook af van de configuratie van de NAS-firmware. Verschillende maatregelen helpen om schijfsectoren op te sporen die niet langer leesbaar zijn, terwijl er nog redundantie is. De meest complexe onderhoudsfunctie is scrubbing (zie artikel). Gewoonlijk wordt scrubbing met lage prioriteit uitgevoerd, om de normale toegang niet te ­vertragen.

Dat kan echter nog steeds hinderlijk zijn omdat het systeem urenlang voortdurend toegang nodig heeft tot de schijven. Dat veroorzaakt lawaai en kost elektriciteit, bijvoorbeeld 1 kWh als een NAS gedurende 20 uur 50 watt verbruikt.

Belang van e-mailfunctie van de NAS-firmware in te stellen

Het is erg belangrijk om de e-mailfunctie van de NAS-firmware in te stellen (en te testen). Anders zou je het defect van een schijf te laat opmerken. De NAS moet ook mails versturen als de SMART-diagnose die in de harde schijven is ingebouwd, abnormale gegevens oplevert. Een typische SMART-waarde die een naderend onheil aankondigt is de Reallocated Sector Count. Die houdt bij hoeveel sectoren de harde schijf heeft vervangen door reservesectoren. Als die waarde plotseling toeneemt, moet je de schijf onmiddellijk controleren.

Hot spare installeren

Als de NAS (of de server) genoeg schijf-bays heeft, afhankelijk van de RAID-firmware, kun je bij voorbaat al een extra schijf installeren als reserve, een zogeheten hot spare. Zodra een schijf uitvalt, start het RAID-beheer dan automatisch een rebuild met de reserveschijf. Dat kost echter extra geld, verhoogt het energieverbruik en de schijf veroudert met de jaren.

Slijtage

Harde schijven zijn aan slijtage onderhevige onderdelen die op een bepaald moment onvermijdelijk defect raken. De fabrikanten noemen een Annualized Failure Rate (AFR) in de orde van 0,35 tot 0,9 procent. Alle ons bekende studies uit de praktijk, zoals die van Google en Backblaze, laten echter hogere percentages zien – meestal in de orde van ééncijferige percentages per jaar. Met te oude schijven neemt ook het risico toe dat ze een RAID-reconstructie niet aankunnen, die uren of zelfs dagen van continue toegang met zich meebrengt. Daarom moeten harde schijven na drie tot zes jaar worden vervangen door nieuwe (zie de garantieperiode).

Oude schijven als tijdelijk archief

Oude schijven kunnen worden bewaard als extra back-up, bij voorkeur op een veilige andere plaats. Ze zijn echter niet langer geschikt als betrouwbare opslag voor archivering op lange termijn. Alvorens ze weg te doen, moeten ze veilig worden gewist, zo nodig – als ze niet meer werken – door mechanische vernietiging.

Datarecoverybedrijven wijzen er herhaaldelijk op dat defecte harde schijven ten hoogste de helft van alle bestandsverliezen veroorzaken – de rest is te wijten aan bedieningsfouten, andere hardwarefouten (connectors, NAS-hardware), diefstal, brand en waterschade. Alleen back-ups bieden een oplossing.

Meerdere RAID-arrays voor grote bestanden

Om onderhoud en noodherstel te versnellen, kun je grote datavolumes verdelen over meerdere RAID-arrays. Als je bijvoorbeeld een archief hebt waarvan de inhoud zelden verandert, zul je er minder vaak back-ups van ­nodig hebben. Als er een extreem grote opslagcapaciteit nodig is, kan het zinvol zijn om de bestanden te verdelen over twee of meer NAS-apparaten. Cloudopslag kan worden gebruikt als extra (versleutelde) back-up of lange­termijnarchief.

Het aansluiten van een NAS op een noodstroomvoorziening (UPS) voorkomt problemen die worden veroorzaakt door stroomstoringen. NAS-firmware heeft gewoonlijk functies om waarschuwingsberichten van een via USB of LAN aangesloten UPS te verwerken en om af te sluiten in geval van een spanningsdip.

Continu draaien of parkeren

Telkens weer hoor je de tip dat RAID-schijven continu moeten draaien in plaats van de schijfmotor uit te schakelen (spindown) na een bepaalde tijd zonder toegang. Op voorwaarde dat het betreffende systeem de energiebesparingstechnologie naar behoren ondersteunt, is daar echter niets op tegen – integendeel: het bespaart energie, wat op zijn beurt de gemiddelde temperatuur en dus de belasting van de schijven verlaagt. Het duurt echter enige tijd om de harde schijven weer op te starten, dus je moet wat langer wachten op de eerste toegang. Veel huidige schijven zijn ontworpen voor 600.000 load/unload-cycli, wat betekent dat de servomotors voor de lees/schrijfkoppen die verplaatsen naar een parkeerzone naast de magnetische schijven.
Zelfs als een NAS vijf jaar zou draaien – dat wil zeggen meer dan 52.000 uur – en de schijven elk half uur zouden worden gestopt en opnieuw opgestart, zouden ze nog ver onder de opgegeven maximumwaarden ­blijven.

TEST: Herstelwerk NAS RAID

We probeerden verschillende RAID-configuraties uit met twee NAS-systemen van de marktleiders Synology en Qnap, elk met vier bays (4-bay NAS) – zie de tabel. Een RAID 1 van twee 10TB-schijven, een RAID 10 van vier 10TB-schijven, en een RAID 5 van vier 4TB- en vier 10TB-schijven. Het opzetten van die RAID-arrays nam steeds verscheidene uren in beslag. Gedurende die tijd kunnen ze wel al gedeeltelijk als gegevensopslag worden gebruikt, maar niet met volledige prestaties.



We vulden de RAID-arrays van 4 × 4 en 2 × 10 TB met elk 7 TB aan data. We gebruikten dus niet de volledige capaciteit. We kopieerden 14 TB aan bestanden naar elk van de arrays van vier schijven van 10 TB. Die gegevens hebben we gecreëerd uit een mix van grote en kleine bestanden vol willekeurige waarden, met de CubicDesign File Generator. Al bij het kopiëren van de bestanden van een externe USB 3.0-schijf naar de RAID waren er grote verschillen: de Synology-­NAS had 10 tot 78 procent langer nodig dan die van Qnap.

We hebben vervolgens onderzocht hoe lang het scrubben duurt door de logbestanden van de NAS te analyseren. Qnap scrubt aanzienlijk langzamer dan Syno­logy en biedt geen scrubben voor RAID 1 en 10 in de QTS 4.5.1 NAS-firmware, alleen voor RAID 5.

Test: Storing simuleren

Tenslotte hebben we één schijf tegelijk uit de RAID getrokken om een storing te simuleren en vervolgens een nieuwe schijf in de RAID gestoken om het rebuildproces te starten. Daarbij lagen Synology en Qnap dichter bij elkaar, maar meestal was Qnap sneller – maar de willekeurig gekozen Qnap TS-473 NAS heeft ook vier cpu-cores in plaats van slechts twee, en 4 GB RAM in plaats van 2 GB, vergeleken met de Synology DS420+.

Door de duur van de verschillende operaties te vergelijken, wordt duidelijk dat scrubbing en rebuilden altijd alle sectoren van de schijven verwerkt – ongeacht de benutte capaciteit van de RAID-array. Sommige bewerkingen zijn veel sneller bij een RAID 5 van vier kleinere schijven dan bij een RAID 1 van twee grotere schijven omdat de NAS meerdere schijven tegelijk ­aanspreekt. Maar aangezien de huidige NAS-schijven doorgaans veel sneller zijn dan de gigabit-ethernetinterface, heeft dat weinig effect op toegang vanaf het netwerk.

Rebuild tijdsduur

Uit de absolute cijfers blijkt dat een rebuild ten minste acht uur duurt, zelfs met een relatief kleine RAID 5 bestaande uit vier 4TB-schijven. Dat is nog altijd sneller dan het terugzetten van een back-up van 7 TB, om nog maar te zwijgen van de extra tijd die het zou kosten om een nieuwe RAID-array aan te maken. Het kopiëren via usb verliep trager, deels omdat onze testgegevens veel kleine bestanden bevatten, waarbij het bestands­systeembeheer de boel vertraagt. De RAID-onderhoudsfuncties werken daarentegen op sectorniveau en sequentieel, dus bijna tegen de maximale schijfsnelheid.

Conclusie

Als je een goedkope NAS betrouwbaar wilt laten werken, moet je de beperkingen van de eenvoudige RAID-functies kennen.

  • Een RAID 1 met 4 tot 10 TB moet vrij betrouwbaar draaien, met een RAID 5 met 50 TB heb je meer kans op problemen.
  • Met de keuze van geschikte schijven en een goede configuratie verminder je het ­risico op storingen aanzienlijk – maar uiteindelijk beschermen alleen back-ups.
  • Als je enorme hoeveelheden bestanden op betrouwbare wijze moet opslaan, moet je kijken naar opslagsystemen voor professionals die de data beschermen met geavanceerdere methoden dan RAID.

(Deze informatie is afkomstig uit het artikel van Christof Windeck en Marco den Teuling, en verscheen eerder in c’t 6, 2021, p114)


 

c’t 11/2024

Deel dit artikel

Marco den Teuling
Marco den TeulingHad als eerste eigen computer ooit een 16-bit systeem, waar van de 48 kilobyte toch echt niet ‘genoeg voor iedereen’ was. Sleutelt graag aan pc’s, van de hardware tot het uitpluizen van de BIOS-instellingen. Vindt ‘Software as a Service’ een onbedoeld ironische naamgeving.

Lees ook

Betrouwbaarheid multi-terabyte-schijven in een NAS-RAID

Opslagsystemen met terabyte schijven in een NAS RAID met de beste kenmerken in datacenters met goede voorzieningen en databeveiliging.

Zo heb je je NAS-beveiliging goed voor elkaar

Als je al je bestanden back-upt met een NAS, moet je via de NAS-beveiliging zorgen dat deze veilig zijn en blijven. Zonder voorzorgsmaatregelen kun je...

1 Praat mee
avatar
  Abonneer  
nieuwsteoudste
Laat het mij weten wanneer er
C. Beerse
Lezer
C. Beerse

Van zo’n 20 jaar geleden herinner ik mij een eigen test met een toenmalige HP DL380 G2 server. Daar stond in de specificatie dat de rebuild van een raid array zo’n 10 tot 15 minuten per gigabyte duurt. Dat is voor mij altijd een vuistregel gebleven, dan valt het mee als het sneller is. Wel herinner ik mij dat in zo’n raid een instelling mogelijk is: Voorrang voor de rebuild, voorrang voor het gebruik of onderling gelijk.

Mooi te zien dat het met de huidige systemen al richting de 500 GByte/uur gaat zoals ik dat uit de tabel lees.