RAID (IT)

Den RAID er et sett av teknikker for lagring virtualisering tillater distribusjon av data over flere diskstasjoner for å øke enten ytelsen eller sikkerhet eller feiltoleranse av hele eller systemer.

Den akronym RAID ble definert i 1987 ved University of Berkeley (California), i en artikkel kalt A Case for Redundant Arrays av rimelige disker (RAID) , eller "overflødig gruppering av billige disker". I dag har ordet blitt et akronym for Redundant Array of Independent Disks , som betyr "overflødig gruppering av uavhengige disker". Kostnaden per megabyte harddisker som ble delt med 1 300 000 på 29 år, i dag velges RAID av andre årsaker enn kostnaden for lagringsplass.

Historisk

I 1978 arkiverte en IBM- ansatt , Norman Ken Ouchi, patent på et "System for gjenoppretting av data lagret i en defekt lagringsenhet", som ble beskrevet som det som senere skulle bli RAID 5 . Dette patentet nevner også skivespegling ( som senere vil bli kalt RAID 1 ), samt beskyttelse med en dedikert paritet (tilsvarende det som senere vil bli kalt RAID 3 eller RAID 4 ).

RAID-teknologi ble først utviklet av en gruppe forskere ved University of California i Berkeley i 1987 . De studerte muligheten for å få to eller flere harddisker anerkjent som en enhet av systemet. Resultatet var et lagringssystem med mye bedre ytelse enn enkle harddisksystemer, men med svært dårlig pålitelighet. Forskerne vendte seg deretter til overflødige arkitekturer for å forbedre feiltoleransen til lagringssystemet.

I 1988 ble de forskjellige RAID-typene 1 til 5 formelt definert av David Patterson, Garth Gibson og Randy Katz i publikasjonen med tittelen " A Case for Redundant Arrays of Inexpensive Disks (RAID) ". Denne artikkelen introduserte begrepet “RAID”, som umiddelbart ble overtatt av disken industrien, og tilbyr fem ulike nivåer eller moduser, hver med sine egne fordeler og ulemper, sammenligner dem til “SLED” ( Enkeltrom Large) modell Dyrt Disk. : se nedenfor).

Beskrivelse og begreper

RAID / SLED sammenligning

Siden oppstarten har RAID-arkitekturens viktigste særegenhet vært dens evne til å kombinere flere rimelige og høyteknologiske lagringsenheter i et enkelt utvalg, slik at denne grupperingen gir økt pålitelighet og / eller ytelse, til en mye lavere kostnad enn en enkelt , toppmoderne lagringsenhet med tilsvarende kapasitet. RAID-arkitekturen er derfor i motsetning til SLED-arkitekturen ( Single Large Expensive Disk ), som er basert på bruk av en enkelt harddisk med høy kapasitet og høy ytelse, derfor til en høy pris, fordi den ene - den må ikke bare være i stand til å lagre mye informasjon, men det må også være av utmerket kvalitet for å garantere bærekraft og tilgjengelighet av det ikke-overflødige innholdet.

Faktisk, i en SLED-type arkitektur, er god datalagring avhengig av den minste feil på harddisken. Når en feil oppstår, er ikke bare systemet ubrukelig mens den defekte maskinvaren byttes ut, men den eneste måten å gjenopprette dataene på er å gjenopprette den siste sikkerhetskopien , som kan ta flere timer hvor systemet er nede.

Selv om en slik periode med inaktivitet er akseptabel for en persons datamaskin, er det derimot uoverkommelig for et selskaps datasystem , som en slik feil kan få betydelige konsekvenser for. Bruken av en RAID-arkitektur, i det minste i de fleste funksjonelle nivåer, gjør det mulig å gi et svar på disse behovene, fordi ikke bare feilen på en av diskene i matrisen ikke forstyrrer driften av sammen, noe som tillater systemet skal fortsette å operere, men i tillegg blir innholdet automatisk gjenoppbygd fra de andre stasjonene når den mislykkede stasjonen byttes ut under normal systemdrift. Dermed kan virksomheten i hele hendelsens varighet fortsette uavbrutt og gjennomsiktig.

RAID, avhengig av funksjonelle nivåer, hvis den gir responstider som er identiske med diskene hvis de ble brukt hver for seg, gir betydelig høyere gjennomstrømninger , til og med ved bruk av billige harddisker med gjennomsnittlig ytelse, samtidig som den garanterer høy ytelse. Mye bedre pålitelighet (unntatt for RAID 0 som reduserer den like mye som antall disker - se forklaringer nedenfor). I slike situasjoner er RAID-arkitekturer derfor ideelle, både med tanke på ytelse og pålitelighet . I alle fall fortsatt helt transparent for brukeren som, uavhengig av antall fysiske disker brukes til å bygge RAID, vil bare noen gang se en eneste stor logisk volum, som han vil få tilgang på en svært vanlig måte RAID. Gjennom drifts systemet .

Paritet og overflødighet

Speiling viser seg å være en kostbar løsning, siden det er nødvendig å skaffe lagringsenhetene i flere eksemplarer, for å ha tilgjengelig bare en brøkdel av den totale kapasiteten (vanligvis halvparten). Med utgangspunkt i prinsippet om at flere lagringsenheter har lav sannsynlighet for å mislykkes samtidig, har andre systemer blitt designet, inkludert de som gjør det mulig å regenerere de manglende dataene fra dataene som er tilgjengelige og fra tilleggsdata, kalt redundans .

Det enkleste og mest brukte redundanssystemet er paritetsberegningen . Dette systemet er basert på den logiske operasjonen XOR (eksklusiv OR) og består i å bestemme hvorvidt antall bits i tilstanden er jevn eller merkelig på de aktuelle databitene . Hvis antall er like, er paritetsbiten verdt . Hvis antallet er odd, er paritetsbiten verdt . Når en av de således dannede databitene blir utilgjengelig, er det da mulig å regenerere den manglende biten ved å bruke den samme metoden igjen på de gjenværende elementene. Denne teknikken brukes i RAID 5-systemer. $ikke$ $1$ $1$ ${\ displaystyle 0}$ $1$ $1$ $n + 1$ $ikke$

Det er mer komplekse redundanssystemer som kan generere flere redundanselementer for å støtte fraværet av flere elementer. RAID 6 bruker for eksempel en teknikk for paritetskalkylering basert på polynomer .

De forskjellige typene RAID-systemer

RAID-systemet er:

eller et redundanssystem som gir datalagring en viss toleranse for maskinvarefeil (f.eks. RAID 1).
eller et distribusjonssystem som forbedrer ytelsen (f.eks. RAID 0).
enten begge samtidig, men med mindre effektivitet (f.eks. RAID 5).

RAID-systemet er derfor i stand til å administrere distribusjonen og konsistensen av disse dataene på en eller annen måte. Dette kontrollsystemet kan være rent programvare eller bruke dedikert maskinvare.

Programvare RAID

I RAID-programvare er kontrollen av RAID fullstendig sikret av et programvarelag i operativsystemet. Dette laget settes inn mellom hardware-abstraksjonslaget (driver) og filsystemlaget.

fordeler

Dette er den billigste metoden siden den ikke krever noe ekstra materiale.
Denne metoden har stor fleksibilitet i administrasjon (programvare).
Denne metoden har fordelen av kompatibilitet mellom alle maskiner utstyrt med samme RAID-programvare (dvs. det samme operativsystemet).

Ulemper

Den største ulempen er at denne metoden er avhengig av hardware-abstraksjonslaget til enhetene som utgjør RAID-volumet. Av en rekke årsaker kan dette laget være ufullkommen og mangler noen viktige funksjoner, som maskinvarefeildeteksjon og -diagnostikk og / eller lagringsstasjon hot-swap-støtte .
Programvarestyring av RAID monopoliserer systemressurser (litt prosessoren og spesielt systembussen ) som kan brukes til andre formål. Nedgangen i ytelse på grunn av programvarestyring av RAID er spesielt merkbar i konfigurasjoner der systemet må overføre de samme dataene flere ganger, som i RAID 1, og ganske lavt i konfigurasjoner uten redundans, vanligvis i RAID 0.
Å bruke RAID-programvare på systemdisken er ikke alltid mulig.

Ulike implementeringer

De fleste operativsystemer allmennheten allerede brukes til å implementere programvare RAID, det være seg Windows , ulike Linux-distribusjoner , eller Mac OS X .

Microsoft Windows XP (og høyere) administrerer RAID 0 og 1 programvare, og kan administrere RAID 5 med en liten tilpasning.
Microsoft Windows 2003 Server-programvare administrerer RAID 0, 1 og 5.
Mac OS X- programvare administrerer RAID 0, 1 og sammenkobling.
Den Linux-kjernen (> = 2,6) programvare styrer RAID 0, 1, 4, 5, 6 og 10, så vel som kombinasjoner av disse modi.

RAID- er for Microsoft Windows og Linux- programvare er inkompatible med hverandre .

Pseudo-hardware RAID

De aller fleste rimelige RAID-kontrollere som er innebygd i mange hovedkort siden 2004/2005, støtter RAID 0 og 1 på IDE- eller SATA- harddisker . Til tross for markedsføringsdiskursen på den tiden som pleide å villede systematisk på dette punktet, er det ikke strengt tatt hardware RAID, men snarere en diskkontroller med noen avanserte funksjoner. Fra et strengt maskinvareperspektiv er denne hybridløsningen ikke forskjellig fra RAID-programvaren. Det er imidlertid forskjellig i plasseringen av programvarerutinene for å administrere RAID.

Med nyere maskinvare er forskjellen mellom pseudo-hardware RAID og hardware RAID rent teoretisk. Den eneste praktiske forskjellen er at i pseudo-hardware RAID er ikke prosessor og minne dedikert. Imidlertid betyr kraften til nyere prosessorer og de reduserte minnekostnadene at denne begrensningen ikke lenger er et kritisk element. Den eneste gjenværende fordelen for spesialisert RAID er å tilby mer effektive verktøy for hendelsesadministrasjon.

fordeler

Hovedinteressen for denne typen RAID er å gi en løsning på det tredje problemet med programvare RAID, nemlig at det ikke alltid kan brukes til å være vert for filene i operativsystemet, siden det er nettopp det sistnevnte som gir tilgang til det.
I denne typen RAID gjør tilstedeværelsen av en BIOS som integrerer de grunnleggende programvarerutinene for å administrere RAID det mulig å laste inn viktige filer i operativsystemet (kjernen og hoveddriverne) i minnet, deretter kontrollerdriveren, som integrerer de samme programvarerutinene for å administrere RAID og gir deretter de øvre lagene av operativsystemet ikke tilgang til periferiutstyr, men tilgang til RAID-volumet som det emulerer.

Ulemper

Bortsett fra denne viktige fordelen, kombinerer denne typen RAID ulempene med de to andre tilnærmingene:

Ytelsesbegrensningene er de samme som for RAID-programvare, da det faktisk er skjult programvare-RAID.
Et betydelig problem med disse hybridkontrollerne er deres dårlige håndtering av maskinvarefeil og generelt begrenset BIOS-funksjonalitet.
Den interoperabilitet er svært dårlig, spesielt med tanke på at det er generelt om hardware integrert i hovedkort av datamaskinene. Verre, å endre hovedkortet, hvis det nye bruker forskjellige sett med sjetonger, eller til og med bare BIOS-versjonen, kan det hende at du må bygge om RAID helt. Ombygging er vanligvis mulig hvis man forblir i RAID-kontrollere av samme merke og forskjellige modeller, men det er ingen definert regel for kompatibilitet.
Den påståtte påliteligheten til disse enhetene er ganske kontroversiell .

Maskinvare RAID

I tilfelle hardware RAID tildeles et kort eller en komponent for å administrere operasjoner. RAID-kontrolleren kan være intern i sentralenheten (utvidelseskort) eller deporteres i en lagringsplass .

En raid-kontroller er vanligvis utstyrt med en bestemt prosessor, dedikert minne, muligens et reservebatteri, og er i stand til å administrere alle aspekter av RAID-lagringssystemet takket være innebygd mikrokode ( firmware ).

Fra et operativsystemperspektiv gir RAID-kontrolleren full virtualisering av lagringssystemet. Operativsystemet behandler hvert RAID-volum som et enkelt lagringsvolum og har ingen kjennskap til dets fysiske bestanddeler.

fordeler

Maskinvare-RAID-kontrollere gir feildeteksjon, hot swapping av mislykkede stasjoner og muligheten til å gjenoppbygge mislykkede stasjoner. (Men avanserte operativsystemer tillater dette også hvis maskinvaren tillater det.)
Systemet belastning (hovedsakelig bus belegg ) blir lettet (dette er spesielt følt i tilfelle av konfigurasjoner med flere plater og høy redundans).
Operasjonene for å kontrollere konsistens, diagnostisk vedlikehold utføres i bakgrunnen av kontrolleren uten å kreve systemressurser.

Ulemper

RAID-kontrollere for maskinvare bruker hvert sitt system til å administrere lagringsenheter. Som et resultat, i motsetning til RAID-programvare, kan ikke disker som overføres fra ett system til et annet, gjenopprettes hvis RAID-kontrolleren ikke er nøyaktig den samme ( inkludert firmware ). Det anbefales derfor å ha et andre kort i tilfelle feil på det første. Dette er imidlertid ikke alltid sant, i det minste i raid 1, kan diskene, overflødige i speilet, brukes montert på separate enheter og dermed tillate deres fine maskinvarekontroll for eksempel (dette må kontrolleres for hver maskinvarekonfigurasjon).
Entry-level-kort har mye lavere prosessorer enn dagens datamaskiner. Vi kan derfor ha mye dårligere ytelse til en pris som er høyere enn for en programvare-RAID.
Kostnaden: inngangsnivået er rundt € 200, men mer effektive kort kan ofte overstige € 1000 .
RAID-kontrolleren i seg selv er en maskinvare som kan mislykkes. Programvaren ( firmware ) kan inneholde feil, noe som er en annen potensiell risiko for ett punkt-for-feil . (Den ofte ti års garantien for denne typen maskinvare ber imidlertid produsenter om å være spesielt oppmerksomme på å skrive firmware , noe som i praksis reduserer denne risikoen.)
Ulike produsenter av RAID-kontrollere tilbyr programvarehåndteringsverktøy som er veldig forskjellige fra hverandre (og noen ganger av varierende kvalitet). I motsetning til dette er RAID-styringsverktøy for programvare som leveres med et operativsystem generelt godt integrert i det systemet.
Varigheten av støtten til en RAID-kontroller fra produsenten (korrigering av feil i firmware , for eksempel), noen ganger knyttet til ankomsten av nye produkter som gjør de gamle foreldede, kanskje kortere eller mer ustabile enn støtten til Software RAID av leverandøren av operativsystemet. Produsenten kan til og med forsvinne (noe som er sjeldnere blant produsenter av operativsystemer).
Mindre fleksibilitet sammenlignet med programvare RAID, som har et abstraksjonslag som tillater RAID-styring over alle typer blokkenheter som støttes av operativsystemet, lokalt eller eksternt ( ATA , SCSI , ATA over Ethernet , iSCSI ... og alle mulige kombinasjoner mellom dem). RAID-kontrollere er spesialisert for en enkelt type blokkanordning.

De forskjellige nivåene av RAID

Standard nivåer

De forskjellige typene RAID-arkitektur er nummerert fra 0 og kan kombineres med hverandre (vi snakker da om RAID 0 + 1, 1 + 0 osv.).

RAID 0: stripet volum

RAID 0, også kjent som “disk striping” eller “ striping volume” , er en RAID-konfigurasjon som øker ytelsen til arrayet betydelig ved å få harddisker til å fungere parallelt (med ). $ikke$ $n \ ge2$

Kapasitet Den totale kapasiteten er lik den for det minste elementet i klyngen multiplisert med antall elementer som er tilstede i klyngen, da stripesystemet vil sette seg fast når den minste disken er full (se diagram). Overflødig plass til de andre elementene i klyngen forblir ubrukt. Det anbefales derfor å bruke disker med samme kapasitet. Pålitelighet Ulempen med denne løsningen er at tap av en enkelt lagringsenhet resulterer i tap av alle data på RAID-volumet. Koste I en RAID 0, som ikke gir noen redundans, brukes all tilgjengelig diskplass (forutsatt at mediene har samme kapasitet).

I denne konfigurasjonen distribueres dataene i striper av fast størrelse. Denne størrelsen kalles granularitet (se delen Granularitet nedenfor).

Eksempel Med en RAID 0 som har en stripestørrelse på 64 kiB og består av to disker (disk Disk 0 og disk Disk 1 ), hvis vi vil skrive en fil A på 500 kiB, blir filen delt inn i 8 striper (bil ). La oss kalle dem 1, 2, 3, 4, 5, 6, 7 og 8. De vil bli fordelt på alle diskene som følger:

7 <\ frac {500} {64} \ le 8

Disk 0: 1, 3, 5, 7 Disk 1: 2, 4, 6, 8 Dermed kan skrivingen av filen utføres samtidig på hver av diskene i en tid som tilsvarer skrivingen på 256 kiB, noe som tilsvarer en dobling av skrivehastigheten.

Således, på en RAID 0 av disker (med ), må hver disk bare lese og skrive data, noe som har den effekt at tilgangstidene (lesing og skriving) til dataene reduseres. Ettersom diskene deler arbeidet, akselereres behandlingen. $ikke$ $n \ ge2$ $\ frac {1} {n}$

Bruker

Denne typen RAID var perfekt for applikasjoner som krever rask behandling av store datamengder med harddisker. Men denne arkitekturen gjør ingenting for å sikre datasikkerhet. Dette er fordi hvis en av stasjonene mislykkes, går alle dataene på RAID-volumet tapt.

RAID 0 ble brukt i datamaskiner, i applikasjoner som krever store dataoverføringer ( videoredigering ...), snarere enn i NAS .

Den kan brukes til å øke båndbredden til en server som krever lagringsmedier som er i stand til å støtte veldig store mengder skriving.

Merk : i hardware RAID er det sjelden mulig å migrere fra en RAID 0 med flere disker til en RAID 1, mens det motsatte er sant. Det er derfor mer fleksibelt å starte i RAID 1.

RAID 1: Speilvendte disker

RAID 1 er bruk av overflødige disker (med ) hver disk som inneholder klyngen til enhver tid nøyaktig de samme dataene, derav bruken av "speil" ( speiling engelsk). $ikke$ $n \ ge2$

Kapasitet Den totale kapasiteten er lik den for det minste elementet i klyngen, med overflødig plass til andre elementer i klyngen forblir ubrukt. Det anbefales derfor å bruke elementer med identisk kapasitet. Pålitelighet Denne løsningen tilbyr et utmerket nivå av databeskyttelse. Det fungerer så lenge det er minst en funksjonell disk igjen. Koste Lagringskostnadene er høye og direkte proporsjonale med antall brukte speil, mens den brukbare kapasiteten forblir uendret. Jo høyere antall speil, jo mer øker sikkerheten, men jo mer blir kostnadene uoverkommelige.

Lesetilgang til operativsystemet gjøres på den lettest tilgjengelige disken på den tiden. Skriver til matrisen gjøres samtidig til alle diskene, slik at enhver disk til enhver tid kan byttes ut.

Når en av stasjonene svikter, deaktiverer RAID-kontrolleren (gjennomsiktig for datatilgang) den krenkende stasjonen. Når den defekte disken er byttet ut, rekonstruerer RAID-kontrolleren speilet, enten automatisk eller ved manuell inngrep. Når den er synkronisert, går RAID tilbake til sitt opprinnelige redundansnivå.

Merk : migrering fra RAID 1 til RAID 0, RAID 5, RAID 6 er nesten alltid mulig, noe som gjør RAID 1 til en god startløsning hvis det ikke er noe betydelig ytelseskrav.

RAID 5: stripete volum med distribuert paritet

RAID 5 kombinerer metoden for stripete volum ( striping ) til en distribuert paritet. Dette er et overflødig sett $N + 1$ . Pariteten, som er inkludert i hver skriving, fordeles sirkulært på de forskjellige diskene. Hvert bånd består derfor av datablokker og en paritetsblokk. I tilfelle svikt i en av diskene i matrisen, vil det for hvert bånd enten mangle en datablokk eller paritetsblokk. Hvis det er paritetsblokk, er det greit, fordi ingen data mangler. Hvis det er en datablokk, kan innholdet beregnes fra de andre datablokkene og paritetsblokken. Dataintegriteten til hvert bånd er bevart. Så ikke bare er klyngen fortsatt i orden, men det er også mulig å gjenoppbygge disken når den er byttet ut fra data- og paritetsinformasjonen på de andre diskene. $IKKE$ $N-1$

Vi kan derfor se at RAID 5 støtter tap av bare en disk om gangen, noe som blir et problem siden diskene som utgjør en klynge blir stadig større (1 TB og mer), fordi tid gjenoppbygger paritet i tilfelle en mislykket disken forlenges (noe som øker sannsynligheten for at en ny feil oppstår fordi andre harddisker er under tung belastning under ombyggingen). Dermed er rekonstruksjonstiden vanligvis rundt 2 timer for 300 GB disker mot rundt ti timer for 1 TB . For å begrense risikoen er det vanlig å legge til en ekstra stasjon ( reserve ), dedikert til øyeblikkelig erstatning av en mulig mislykket stasjon: i normal drift er den ubrukt; i tilfelle en disksvikt, tar den automatisk plassen til den mislykkede disken. Dette krever en fase som ofte kalles paritetsrekomputering, som består i å gjenskape den manglende blokken (data eller paritet) på hver nye bånd på den nye disken. Under paritetsberegningsprosessen forblir RAID-volumet normalt, datamaskinen taper bare litt.

Praktisk eksempel: Vurder fire harddisker A, B, C og D, av samme størrelse. Systemet vil distribuere de første blokkene på diskene A, B og C som i RAID 0-modus ( striping ), og på disk D, resultatet av den eksklusive ELLER- operasjonen mellom de andre diskene (her A xor B x eller C). Den vil distribuere følgende blokker på diskene D, A og B, deretter pariteten (dvs. D xeller A x eller B) på disk C, og så videre ved å bytte diskene sirkulært, ved hver blokk. Pariteten fordeles deretter over alle diskene.I tilfelle en disksvikt, kan dataene på den gjenopprettes ved hjelp av xor. Faktisk har XOR-operasjonen ( ) følgende egenskap: vurderer blokker av samme størrelse, og i så fall og generelt .

\ oplus

IKKE

\ scriptstyle A_1, A_2 \ cdots A_N

\ scriptstyle A_1 \ oplus A_2 \ oplus \ cdots A_N = X

\ scriptstyle X \ oplus A_2 \ oplus \ cdots A_N = A_1

\ scriptstyle A_1 \ oplus \ cdots A_ {k-1} \ oplus X \ oplus A_ {k + 1} \ oplus \ cdots A_N = A_k

Det vil si at enhver datablokk som går tapt på grunn av en mislykket disk på en RAID 5- diskstasjon, kan gjenopprettes med kontrolldatablokken.

A_k

N + 1

X

Vi ser derfor at hvis vi ønsker å skrive i en blokk, må vi:

les blokken for å endre;
les paritetsblokken på stripen;
skriv datablokken og paritetsblokken.

Heldigvis lar xor-operasjonen deg beregne den nye pariteten uten å måtte lese datablokkene fra båndet. Derfor øker ikke antall disker i et RAID 5-utvalg ikke lese- eller skrivetiden. Imidlertid, hvis flere prosesser ønsker å skrive samtidig til en eller flere datablokker av samme stripe, blir oppdatering av paritetsblokken et stikkpunkt. Samtidige prosesser blir suspendert når paritetsblokken frigjøres, og derfor begrenser dette skrivehastigheten. Jo mer antall disker i et RAID 5-array øker, jo mer øker rekonstruksjonstiden til en mislykket disk, siden det er nødvendig å lese alle de andre blokkene på stripen og derfor alle de andre for å rekonstruere den manglende blokken i en stripe. disker.

IKKE

Dette systemet krever absolutt minst tre harddisker. Disse skal generelt være av samme størrelse, men mange moderne RAID-kort tillater stasjoner av forskjellige størrelser, selv om dette ikke er optimalt. Den faktiske nyttige lagringskapasiteten for et system med identisk kapasitet er . Hvis det brukes disker med ulik kapasitet, vil systemet bruke minimumskapasiteten i forrige formel. For eksempel tilbyr tre 100 GB- disker i RAID 5 200 GB nyttige; ti disker, 900 GB nyttige. $X$ $vs.$ $(X-1) \ ganger c$

Dette systemet kombinerer sikkerhet (takket være paritet) og god tilgjengelighet (takket være fordelingen av paritet), selv i tilfelle feil på en av lagringsenhetene.

Det er en variant: "Variable RAID 5" hvor hver disk har sin egen kontroll. Alle andre funksjoner er de samme.

Vi har ofte en tendens til å tro at et RAID 5-system er helt pålitelig. Det er faktisk generelt akseptert at sannsynligheten for samtidig feil på flere disker er ekstremt lav - vi snakker åpenbart om en feil som resulterer i fullstendig og permanent tap av tilgang til dataene til flere disker og ikke om en enkel utilgjengelighet av flere disker ... Dette gjelder for en generell feil på en diskstasjon. Dette er imidlertid feil hvis vi ser på som en fiasko en enkelt sektor som har blitt uleselig.

I praksis er det veldig sjelden at alle dataene i et volum blir lest regelmessig. Og selv om dette er tilfelle, blir konsistensen av pariteten bare sjelden sjekket av ytelsesgrunner. Det er derfor sannsynlig at feil som uleselige paritetssektorer vil bli oppdaget i veldig lang tid. Når en av diskene blir virkelig defekte, krever ombygging å gå gjennom alle de gjenværende diskene. Vi kan da oppdage feil som hadde vært usynlige til da.

Alt dette er kanskje ikke alvorlig og resulterer i tap av en minimal datamengde (en disksektor i dette eksemplet er vanligvis 512 byte), men de aller fleste RAID-kontrollere klarer ikke å håndtere delvise feil. Generelt som "mislyktes "en disk som inneholder en enkelt uleselig sektor. Så hvis en harddisk mislykkes, mens det oppstår en uleselig sektor på tidspunktet for ombyggingen, anses to stasjoner å mislykkes samtidig, og RAID 5-volumet blir ubrukelig. Det blir da vanskelig og dyrt å gjenopprette ikke lagrede data.

Et RAID 5-system må derfor kontrolleres og sikkerhetskopieres med jevne mellomrom for å sikre at det ikke er noen risiko for et slikt tilfelle.

Fordeler :

Les ytelse så høyt som i RAID 0, Tåler tapet av en plate.

Ulemper:

Nedgang skriftlig på grunn av paritetsberegningen, Brukbar kapasitet på disker av totalt n disker.

n-1

Lang ombyggingstid for harddisker med stor kapasitet.

Mindre vanlige RAID-nivåer

Sammenkobling av disker

NRAID: Nær / ikke overflødig matrise av billig / uavhengig disk

Disk sammenkobling er prosessen med å legge til kapasiteten til flere harddisker i et logisk volum som er lik størrelse med summen av størrelsene på harddiskene. Denne metoden bruker en sekvensiell skrivemetode: data skrives bare til neste harddisk når det ikke er plass igjen på den forrige.

NRAID er ikke strengt tatt en RAID, og den tillater ikke dataredundans. Svikt i en stasjon kan ha katastrofale konsekvenser for resten av dataene hvis kritiske metadata blir påvirket.
Noen ganger forveksles det feilaktig med JBOD , som angir et lagringssystem som grupperer sammen individuelt tilgjengelige stasjoner uten spesiell konfigurasjon.

NRAID er også referert til som "Simple Volume" under Windows (fra Windows 2000).

RAID 2: stripet volum ved paritet

RAID 2 er nå foreldet. Den kombinerer RAID 0 (striped volume) -metoden med å skrive en Hamming-kode feilkontrollkode (ECC-kode) til en egen harddisk. Imidlertid er skrivingen av denne kontrollkoden nå direkte integrert i harddiskstyringene. Denne teknologien gir et godt sikkerhetsnivå, men dårlig ytelse.

RAID 3 og RAID 4

RAID 3 og RAID 4 er like bortsett fra at førstnevnte opererer i byte og sistnevnte i blokker. RAID 4 krever ikke så mye synkronisering mellom diskene. RAID 3 har derfor en tendens til å forsvinne til fordel for RAID 4 som gir betydelig høyere ytelse.

Disse RAID-nivåene krever en diskmatrise (med ). De første diskene inneholder dataene mens den siste disken lagrer pariteten (se paritetsavsnitt ). $ikke$ $n \ ge3$ $n-1$

Hvis paritetsdisken mislykkes, er det mulig å rekonstruere paritetsinformasjonen med innholdet på de andre datadiskene.
Hvis en av datadiskene mislykkes, er det mulig å rekonstruere informasjonen med innholdet på de gjenværende datadiskene og den på paritetsdisken.

Det er viktig at paritetsdisken har god kvalitet, fordi den hele tiden er under stress for skriving. Dette siste punktet er en av begrensningene ved RAID 3.

På samme måte, hvis mer enn en stasjon mislykkes, kan tap av data ikke utbedres.

RAID 6

RAID 6 er en utvikling av RAID 5 som øker sikkerheten ved å bruke overflødig informasjon i stedet for en. Den tåler derfor disksvikt . De matematiske grunnlagene som brukes til redundansinformasjonen for RAID 6 er mye mer komplekse enn for RAID 5; Derfor er implementeringene av algoritmen ofte begrenset til (dvs. tap av to disker). $ikke$ $ikke$ $n = 2$

Hvis sikkerheten er større, er materialkostnaden høyere og hastigheten lavere. CPU-kraften som kreves for å beregne permitteringer og spesielt å gjenoppbygge et defekt volum er også betydelig større.

De største feilene er:

Skrivetider utvides på grunn av komplekse redundansberegninger.
Ombyggingstiden i tilfelle samtidig svikt på to disker utvides betydelig.

RAID 6 ble lite brukt på grunn av merkostnaden. Imidlertid har økningen i harddiskkapasiteten de siste årene, samt populariseringen av profesjonelle løsninger basert på SATA-disker, vekket ny interesse for bruk av RAID 6, enten gjennom RAID-kontrollere for maskinvare eller via maskinvare. Software RAID (Linux 2.6-kjernen inkluderer RAID 6).

Den totale brukbare kapasiteten ( ) for et system med disker reservert for redundans er ( = kapasiteten til den minste harddisken). $Kutte opp}$ $k$ $ikke$ $C_ {Ut} = (kn) \ ganger c$ $vs.$

Interessante, men litt vanskelige forklaringer er tilgjengelige i den engelske versjonen av denne artikkelen, så vel som i The Mathematics of RAID 6 .

RAIDn

Et patentert lagringssystem kalt RAIDn hevder å overgå kapasitetene til RAID 6.

RAID DP

RAID DP ( Dual Parity ) ligner RAID6 bortsett fra at i RAID DP er paritetsskivene faste. Denne typen RAID blir vanligvis brukt på NAS- lagringsservere . NetApp- selskapet bruker denne teknologien.

Kombinert RAID-nivå

I utgangspunktet er et kombinert RAID-nivå bruk av et klassisk RAID-konsept på byggesteiner som i seg selv er resultatet av et klassisk RAID-konsept. Konseptet som brukes kan være likt eller annerledes.

Syntaksen er fremdeles litt uklar, men det første tallet kan generelt betraktes som en indikasjon på nivået på “klynger” raid og det andre som indikerer det totale RAID-nivået. I absolutte termer hindrer ingenting å forestille seg kombinert RAID med 3 eller flere trinn, men for øyeblikket forblir dette mer av teorien og eksperimenteringen.

Det store (og økende) antall mulige permutasjoner betyr at det er et mangfold av kombinerte RAID-er, og vi vil ikke gjøre en omfattende oversikt. Vi kan imidlertid presentere fordeler og svakheter ved de vanligste.

For følgende beregninger brukes følgende variabler:

$G$ : antall klynger;
$IKKE$ : antall disker per klynge;
$VS$ : kapasitet på en disk (alle diskene antas å være identiske);
$V$ : hastighet på en plate.

Feilterskelene vist nedenfor angir minimum antall mislykkede stasjoner som kan føre til at hele RAID mislykkes (det vil si at under dette antallet mislykkede stasjoner på RAID-volumet i prinsippet ikke kan være feil). I praksis er det mulig at et RAID-volum med mer enn dette antallet mislykkede stasjoner fortsatt vil fungere, men det anbefales at du bytter ut de mislykkede stasjonene så snart som mulig.

RAID 01 (eller RAID 0 + 1)

Det gjør det mulig å oppnå rask speiling siden den er basert på stripete klynger (RAID 0) kombinert i speiling (RAID 1). Siden hver klynge inneholder minst to elementer, og det kreves minst to matriser, kreves det minst fire lagringsstasjoner for å opprette et RAID 0 + 1-volum.

Påliteligheten er gjennomsnittlig fordi en mislykket disk fører til at hele matrisen som inneholder den mislykkes. I tillegg forlenger dette gjenoppbyggingstiden betydelig og forringer ytelsen under ombygging, siden alle diskene er stresset. Hovedfordelen er at når det gjelder et speil med tre eller flere klynger, gjør frivillig fjerning av en hel klynge det mulig å ha en øyeblikkelig sikkerhetskopi uten å miste redundansen.

Total kapasitet:

C_t = N \ ganger C

Topphastighet :

{\ displaystyle V_ {m} = N \ ganger V}

Feilterskel: disker

G

RAID 10 (eller RAID 1 + 0)

Det gjør det mulig å oppnå et samlet volum per bånd med et godt nivå av pålitelighet (siden det er basert på replikerte klynger). Siden hver klynge inneholder minst to elementer og det kreves minimum to matriser, kreves det minst fire lagringsstasjoner for å opprette et RAID 1 + 0-volum.

Dens pålitelighet er ganske høy, siden alle elementene i en klynge må være defekte for å forårsake en total feil. Rekonstruksjonen er ganske effektiv siden den bare mobiliserer diskene til en enkelt klynge og ikke alle.

Total kapasitet:

C_t = G \ ganger C

Topphastighet :

V_m = G \ ganger V

Feilterskel: disker

IKKE

RAID 10 vs. RAID 6

For hjemmeservere som ofte er begrenset til fire disker, virker valget mellom RAID 6 og RAID 10 (eller 1 + 0) problematisk: i begge tilfeller har vi halvparten av den totale diskplassen viet redundans. RAID 6 tar fordelen utover det, da den ikke lenger bruker halvparten av plassen. RAID 6 tolererer også to feil i samme tidsperiode (for eksempel feil på en disk mens du bygger om en annen). Hvis RAID 10 imidlertid fortsatt er foretrukket, er det fordi den er mer reaktiv (mye mindre beregninger på farten er nødvendig) og tillater mye raskere rekonstruksjoner.

RAID 05 (eller RAID 0 + 5)

Samme prinsipp som for 0 + 1 raid, men bruk RAID 5 for den globale delen. Siden hver matrise inneholder minst to disker, og det kreves minimum tre matriser, kreves det minst seks lagringsstasjoner for å opprette et RAID 0 + 5-volum. Denne modusen er ikke av stor interesse sammenlignet med en vanlig RAID 5 med disker, og brukes derfor veldig lite. $N * G$

Total kapasitet:

{\ displaystyle C_ {t} = (G-1) \ times (N \ times C)}

Maksimal hastighet: (denne formelen forsømmer paritetskalkulasjonstidene)

V_m = (N-1) \ ganger (G \ ganger V)

Feilterskel: disker

2

RAID 15 (eller RAID 1 + 5)

Det gir et stripet volum med veldig pålitelig distribuert redundans (siden det er basert på speilede klynger). Hver klynge som inneholder minst to disker, og det er nødvendig med minst tre matriser, krever minst seks lagringsenheter for å opprette et RAID 15.-volum. Denne modusen er veldig pålitelig siden alle diskene i to forskjellige matriser må stoppe. For å fungere for sett det som standard. Denne modusen er imidlertid dyr i forhold til oppnådd kapasitet.

RAID 50 (eller RAID 5 + 0)

Det gir et stripet volum basert på RAID 5. Ettersom hver klynge inneholder minst tre disker, og det kreves minimum to matriser, kreves det minimum seks lagringsenheter for å lage et RAID 5 + 0-volum. Et av de beste kompromissene når du leter etter fart uten å ønske å forringe påliteligheten for mye. Dette fordi det (skjøre) båndaggregatet er basert på overflødige klynger. Det er imidlertid tilstrekkelig at to disker i samme klynge ikke klarer å få den til å mislykkes.

Total kapasitet: (i dette tilfellet er N det totale antallet disker og ikke per klynge)

C_t = (NG) \ ganger C

Maksimal hastighet: (denne formelen forsømmer paritetskalkulasjonstidene)

V_m = N \ ganger (G-1) \ ganger V

Feilterskel: disker

2

RAID 51 (eller RAID 5 + 1)

Det gjør det mulig å oppnå et replikert volum basert på RAID 5-arrays. Hver klynge som inneholder minst tre disker, og minst to arrays er nødvendig, det kreves minst seks lagringsenheter for å lage et RAID 5 + 1-volum. Det er en kostbar modus (lav kapasitet sammenlignet med antall disker).

Total kapasitet:

C_t = (N-1) \ ganger C

Maksimal skrivehastighet: (denne formelen forsømmer paritetskalkulasjonstidene)

V_Mw = (N-1) \ ganger V

Maksimal lesehastighet: (denne teoretiske formelen forutsetter maksimal optimalisering som aldri blir nådd)

V_Mr = G \ ganger (N-1) \ ganger V

Feilterskel: disker

G \ ganger 2

Spesielle RAID-nivåer

RAID 5E

RAID 5E (E for Enhanced ) er en variant av RAID 5 der reservebånd er reservert. Disse båndene fordeles over diskene på en sirkulær måte, i likhet med paritet.

RAID 5EE

RAID 5EE er en variant av RAID 5E som gir bedre ombyggingstider. I motsetning til RAID 5E fordeles ledig plass reservert i matrisen på alle fysiske disker.

5DP RAID

RAID 5DP ( Dual Parity ) ligner RAID 6, bortsett fra at i RAID DP er de to paritetsplatene faste. Denne typen RAID blir vanligvis brukt på NAS-lagringsservere .

RAID TP

RAID TP for Triple Parity RAID-teknologi har samme organisasjon som RAID 6, men bruker tre redundanskoder. Dette gjør at operasjonen kan fortsette etter samtidig svikt i tre stasjoner.

Dobbel paritet

Double parity RAID er designet for å forbedre beskyttelsen av data som er lagret på en gruppe disker mot samtidig svikt i to volumer, der RAID-nivå 3, 4 og 5 bare beskytter mot tap av ett volum. For disse er dataene som skal lagres fragmentert i blokker som skrives til flere disker mens en paritet av disse blokkene beregnes. I tilfelle tap av en av diskene, er denne pariteten resultatet av en matematisk operasjon slik at blokkene som er lagret på de andre diskene og pariteten tillater at data rekonstrueres . Denne pariteten er enten skrevet på en egen disk (RAID 3 og 4), eller distribuert mellom diskene i gruppen (RAID 5). Men hvis to stasjoner mislykkes, går alle lagrede data tapt. For å beskytte mot denne muligheten har flere modeller av dobbel paritet RAID dukket opp: RAID 6, RAID-DP, RAID-ADG, RAIDn ... Alle er basert på det samme prinsippet: to pariteter beregnes og lagres, dvs. på to dedikerte disker. , eller på en distribuert måte på diskene i klyngen. På denne måten er matrisen beskyttet mot samtidig tap av to disker.

RAID 1.5

RAID 1.5 er en utvikling av RAID 1. Lesetilgang gjøres ikke lenger fra en enkelt disk, men parallelt fra alle diskene på samme måte som en RAID 0 (men bare når du leser) som gir en gevinst som er følsom i ytelse, uten å endre påliteligheten.

RAID 7, RAID ADG

Utviklingen av RAID 3 gjør det mulig å betjene alt asynkront . Det har blitt annonsert som 1,5x til 6x bedre enn noen annen RAID . Akkurat som RAID 3 inneholder en enkelt disk paritetene til alle. Hver disk har en SCSI / SATA / Fibre Channel- kontroller ... og systemet styres av et kort som beregner paritet, administrerer hurtigbufferen og styrer diskene .

Denne konfigurasjonen, utviklet av Storage Computer Corporation, er proprietær og er veldig kostbar å sette opp.

IBM ServeRAID 1E

Raid 1E er et tape- speilingssystem som tillater bruk av et antall disker som er større enn to, like eller odde. Dataene kuttes i strimler som dupliseres ( speiles ) på en av de andre diskene i matrisen. Den totale kapasiteten til det logiske volumet er halvparten av det fysiske volumet.

Matrix RAID

Den Intel Matrix Storage Technology er tilgjengelig fra chipset (brikkesett) og ICH6R ICH6RW (2005). Dette er en RAID-løsning basert på 4 Serial-ATA-porter som vil gjøre det mulig å gruppere harddisker i RAID på en mindre restriktiv måte enn dagens løsninger. Faktisk, med to identiske disker, tillater nåværende RAID-kontrollere bare RAID 0 eller RAID 1. Matrix RAID tillater å kombinere, på bare to disker, både RAID 0 og RAID 1. interesse er ikke umiddelbart åpenbar, men for eksempel med to harddisker på 250 GB , er det mulig å lage en RAID 0 ( striping ) på 100 GB (de første 50 GB på hver disk) med rask tilgang, dedikert til systemet, og en 200 GB RAID 1 ( speiling ) sikret med de resterende 400 GB , for lagring av brukerdata. Med tradisjonelle RAID-systemer krever integrering av RAID 0 og RAID 1 i en enkelt konfigurasjon bruk av minst fire disker. Selv om det er åpenbart, la oss legge til at ICH6R ikke tillater å lage RAID 01 eller 10 med bare to harddisker.

Opp til ICH8R / DO er det mulig å gjøre et RAID 5 maksimum med fire disker. Fra ICH9R / DO er det mulig å lage en RAID 5 av seks disker, noe som betydelig øker den tilgjengelige kapasiteten. I tillegg er det med ICH9 / 10 DO mulig å legge til en disk i en eksisterende klynge.

RAID S

Denne proprietære erstatningsmetoden for EMC Symmetrix- løsninger gjør det mulig å implementere en stripet paritet RAID-matrise. Det brukes ikke lenger på nåværende utstyr. Mens RAID S ser ut som RAID 5, har den noe forbedret ytelse, inkludert den som tilbys ved å ha en hurtig hurtigbuffer på batteriet.

Sun RAID-Z

Suns ZFS- system inneholder et redundansskjema som ligner på RAID 5 som kalles RAID-Z. RAID-Z unngår “ skrivehullet” til RAID 5 ved en kopi-på-skriv-regel: i stedet for å skrive over gamle data med nye data, skriver den nye data på et nytt sted og skriver om pekeren til de nye dataene. Dette unngår lesemodifiser-skriv-operasjoner for små poster ved bare å gjøre full-strip- skrivinger . Små blokker skrives i speil i stedet for å være paritetsbeskyttet, noe som er mulig fordi filsystemet er klar over lagringsunderstrukturen og kan tildele ekstra plass om nødvendig . Det er også en RAID-Z2 og en RAID-Z3 som bruker dobbel og trippel paritet. De tillater å miste opptil henholdsvis to og tre stasjoner uten å miste data.

Dette systemet løser også problemene med stille korrupsjon av RAID 5 takket være skrubbeoperasjoner som analyserer alle dataene i klyngen for å oppdage uoverensstemmelser.

RAID-Z-systemet er mindre effektivt enn RAID 5: hver lese- eller skrivetilgang som har tilgang til alle diskene, gjør det ikke mulig å utnytte multiplikasjonen av lesehoder. På den annen side tillater det bruk av RAM-minne som cache (ARC). Det er også mulig å vie SSD-er til rollen som lese-cache (L2ARC) eller skrive cache (ZIL) for å forbedre ytelsen til en klynge.

Synology Hybrid Raid (SHR)

Synologys proprietære teknologi relatert til RAID-systemet, som simulerer driften av en RAID 5 ved å akseptere disker av forskjellige størrelser samtidig som ubenyttet plass minimeres.

X-RAID (NetGear)

X-RAID-systemet er en teknikk utviklet av Netgear på sin ReadyNAS-serie med produkter. Avhengig av antall disker kan du velge mellom de forskjellige RAID-typene og bytte fra den ene til den andre uten tap av data eller nedetid. X-RAID bruker hovedsakelig RAID 1 og 5.

Pålitelighet og justeringer av en RAID-installasjon

Valg av kontroller

De fleste nåværende hovedkort har en integrert RAID-kontroller. Det er alltid best å velge en kontroller som er tilordnet denne oppgaven. I tillegg til det valgte grensesnittet, er hurtigminnet til den dedikerte kontrolleren en viktig faktor i ytelsen til RAID-systemet.

Kontrollørens overflødighet

En parameter du må huske på når du designer en RAID, er antall grensesnitt som styrer diskene ( IDE , SCSI , SATA eller SAS- kort ). Faktisk er RAID-kontrolleren et viktig element for driften av helheten; hvis det mislykkes, forårsaker det utilgjengeligheten av alle elementene i RAID.

Hvis dette punktet anses som avgjørende, er det mulig å løse dette problemet ved å bruke mer enn en kontroller. For eksempel, i tilfelle av en enkel programvare RAID 1 basert på bruk av IDE- disker , anbefales det å koble hver harddisk til en annen kontakt på hovedkortet. I mer komplekse tilfeller, spesielt når du bruker en ekstern diskboks, er det mulig å legge til en eller flere overflødige bukter, noe som gjør det mulig å ikke bare kompensere for mangelen på en av dem, men også å utføre en belastningsbalansering ( lastbalansering ) , som forbedrer ytelsen betydelig, spesielt unngår flaskehalser når det gjelder båndbredde .

Hot plugging ( hotplug / hotswap )

Den snakker voldelig om plater som kan plugges hot ( hotplug / hotswap engelsk), mens det i virkeligheten er systemmatrisen, og kontrolleren må være utformet slik at du kan fjerne eller sette inn harddisker mens systemet er på.

Denne funksjonen er ikke tilgjengelig med alle teknologier:

Selv om det vanligvis ikke er noen fysisk skade, støtter ikke IDE-stasjoner denne funksjonaliteten.
Denne funksjonaliteten håndteres av SATA-stasjoner (forutsatt at kontrolleren også støtter den).
Denne funksjonaliteten håndteres av SCSI-disker (forutsatt at kontrolleren også administrerer den), selv om bussen kan bli forstyrret på tidspunktet for utvekslingen.

Dette tillater:

legge til disker dynamisk, slik at det er mulig å oppgradere datalagringssystemet;
bytt ut defekt utstyr uten å måtte avbryte driften av datasystemet.

Bruken av varmekoblingssystemer gjør det derfor mulig å unngå nedetid under en vedlikeholdsoperasjon.

Reserve disker ( reserve / hotspare )

Reserve disker ( reserve / hotspare på engelsk) begrenser sårbarheten til en RAID-løsning.

En ekstra disk er tilordnet en RAID-enhet, men brukes ikke daglig. Det kalles en reservestasjon. Når en stasjon i matrisen mislykkes, tar reserveenheten over og automatisk over. Denne disken blir deretter gjenoppbygd fra dataene som er tilstede på de andre diskene, noe som kan ta flere timer, avhengig av datamengden. Etter ombygging av stasjonen, går systemet tilbake til et optimalt nivå av sikkerhet og ytelse.

Når reservedisken har blitt tatt i bruk, må den mislykkede disken byttes fysisk mot en ny disk som kan fungere som en ny reservedisk.

Skjult

Den cache er en RAM -minne som brukes til å lagre informasjon som skal leses eller skrives til RAID. Denne bufferen har mye bedre ytelse enn disker (vanligvis over 10 000 ganger raskere), og lar systemet lese eller skrive en serie med informasjon og deretter gå videre til en annen oppgave mens array-kontrolleren slår seg av. Oppgave å "avstakke" operasjonene som skal gjennomføres. Cachen har derfor en veldig viktig positiv innflytelse på systemets totale ytelse.

Lesecache eller "read cache" er et minne der dataene som systemet trenger er forhåndslastet. Driften av den er kompleks i den grad kontrolleren ikke har noen sikkerhet for avlesningene som vil bli bedt om av den, den gir bare ytelsesgevinst hvis spådommen viser seg å være nøyaktig. Data som leses faller oftest i to kategorier: sekvensiell lesing av data og gjentatt tilgang til de samme dataene. Flertallet av lest cacher er derfor basert på den ene siden på bevaring i RAM-minne av dataene som nylig er skrevet eller lest, og på den andre siden på en lesing av følgende data i tilfelle der en sekvensiell lesing nettopp har blitt utført viktig. Størrelsen på lese-hurtigbufferen og egnetheten til predikatsystemet Har veldig stor innvirkning på leseytelsen.

Skrivecache er en buffer der data som skal skrives til disker plasseres før de overføres til dem. Når den ikke er full, det vil si når datamengden som skal skrives ikke overstiger cache-størrelsen, kan systemet sende dataene som skal skrives veldig raskt og utføre andre oppgaver mens kontrolleren er ansvarlig for fysisk skriving til diskene. Skrivecachen øker derfor systemets skriveytelse. Imidlertid, når det gjelder skrivinger der volumet overstiger kapasiteten til hurtigbufferen, må systemet vente til skrivebufferen tømmes før det kan sende mer data. Akseleratoreffekten av hurtigbufferen blir da nesten null, eller til og med negativ på noen kontrollere.

Skrivecaching utgjør en betydelig bekymring for sikkerheten. Faktisk er hurtigbufferminnet som er ustabilt, dataene som er skrevet av systemet i dette minnet, men som ennå ikke er blitt overført til lagringsmediet, tapt i tilfelle strømbrudd eller annen feil. Det kan føre til svært mye tap eller ødeleggelse av data. I noen alvorlige tilfeller kan filsystemets integritet påvirkes, og hele volumet kan bli uleselig. For å løse dette problemet, anbefales det at du ikke aktiverer skrivecaching hvis maskinen får strøm via en omformer og hvis RAID-kontrolleren har en backup av batteriet (dette batteriet holder innholdsbufferen i 30 minutter til 6 timer, avhengig av kontrollermodeller og batteristørrelse).

Merk: Bare ekte “hardware RAID” -kontrollere har hurtigminne. For andre kan programvareekvivalenter ta plass til hurtigbufferen.

Detaljnivå

Granularitet gjelder bare RAID-typer som bruker datastriper. Disse er i utgangspunktet RAID 0 og RAID 5 nivåer, i tillegg til kombinasjonene med andre nivåer, for eksempel raid 10 eller raid 15.

Dette er faktisk størrelsen på databåndene. Denne konfigurerbare størrelsen er vanligvis et multiplum på 512 byte (størrelsen på en sektor). I praksis varierer det vanligvis fra 16 KB til 1 MB . På de fleste RAID-kontrollere er standardverdien 64 kB . Denne standard granulariteten er vanligvis avveien som oppnår best ytelse i de fleste tilfeller. I svært spesifikke brukstilfeller kan det imidlertid være nødvendig å endre det.

Merk : Å bedømme hensiktsmessigheten av disse endringene og innvirkning på ytelsen krever en grundig forståelse av det indre arbeidet til stasjoner, RAID-kontrolleren og filsystemet. Når det er mulig, anbefales det å bruke standardverdien til RAID-kontrolleren.

Mulighetene og grensene for RAID

RAID fritar deg ikke for å utføre vanlige sikkerhetskopier. Dette er fordi flere stasjonsfeil er vanligere enn du kanskje tror (se avsnittet RAID 5 ovenfor). I tillegg ender menneskelige feil (filsletting / korrupsjon) alltid. Et klassisk eksempel på samtidig svikt på flere disker er følgende: en første disk er offer for en hodelanding, og forårsaker forvridning av en del av platene; men platen som fortsetter å rotere begynner å varme seg opp og når en temperatur som er upraktisk for naboene ... Det skal forstås at en av platene som ligger ved siden av den i sin tur kan mislykkes på grunn av for høy lokal temperatur.

I tillegg, ettersom størrelsen på diskene fortsetter å vokse, vil en RAID som overstiger de nyttige 12 TB (RAID 5 med fire fire TB- disker for eksempel) sannsynligvis være umulig å bygge om igjen, fordi man når pålitelighetsgrensen for SATA-kontrollere (unntatt høy -end serverkontroller): Det vil være statistisk nesten sikkert at en lese / skrive-feil vil oppstå under ombygging. Dette vil også være gyldig for RAID-Z.

Hva RAID kan gjøre

redusere risikoen for tap av data i tilfelle feil på lagringsenheten;
redusere produktivitetstap når en stasjon svikter;
forbedre forestillinger.

Hva RAID ikke kan gjøre

fullt ut beskytte mot maskinvarefeil (mulige suksessive feil på flere lagringsenheter eller selve RAID-systemet);
beskytte data mot menneskelige feil (utilsiktet sletting av filer);
beskytte brukeren mot risiko utenfor systemet (elektrisk overbelastning som vil brenne ut alle diskene, brann, tyveri, flom, hærverk);
beskytte data mot virus som kan ødelegge dataene.
beskytt ved naturlig kryptering: raidet er et logisk volum, og kan ikke krypteres (med mindre en kontroller dedikert til et RAID-kort tilbyr det, men som vil involvere flere ressurser). Det er for eksempel nødvendig å opprette en virtuell disk plassert på RAID-volumet, som kan krypteres naturlig.

Hvordan RAID kan være et problem

RAID har en tendens til å gjøre brukerne overtillit. Denne overdreven tilliten til en teknologi, selv om den er veldig robust og veldig pålitelig i prinsippet, kan føre til katastrofer. Å multiplisere antall disker øker risikoen for feil. I tillegg er diskene som brukes av et RAID-utvalg ofte av samme type og alder, og vil derfor ha en lignende levetid. Derfor kan det være lurt å bruke plater som er av samme modell, men ikke den samme serien (i tilfelle en bestemt serie blir funnet å være defekt). Kompleksiteten til RAID-systemet tilfører teknologiske risikoer: sjeldne, men mulige funksjonsfeil i RAID-kontrolleren eller programvaren er fryktet. En defekt disk kan også forstyrre driften av kontrolleren, logisk eller elektrisk, noe som kan føre til tap av flere stasjoner; i tilfelle en gjentatt feil, er det totale tap av en klynge eller til og med hele lagringsenheten mulig.

Det bør også huskes at bruk av RAID-lagringsenhet ikke gir noen beskyttelse mot:

Operativsystemfeil (iboende eller på grunn av et konfigurasjonsproblem eller en komponentkonflikt);
Destruksjon av data ved programvarefeil, virus eller skadelig programvare;
De klassiske fysiske risikoene (brann, flom, tyveri, lyn og ytre overspenninger, interne overspenninger i maskinen osv.), Bortsett fra veldig dyr fjernspeiling .

Det er derfor ikke rimelig å ha full tillit til noe datalagringssystem. Det bør da utføres regelmessige sikkerhetskopier, den sikreste måten å beskytte en database mot skade, er å lagre en sikkerhetskopi på et inert medium på et eksternt sikkert sted, regelmessig oppdatert og kontrollert for gyldigheten og brukbarheten til filene.

Den gradvise økningen i lagringsmedienes kapasitet er en faktor som eksponensielt øker skjørheten til RAID-systemer, som en studie av RAID 5 og 6 har vist.

RAID-evolusjoner

En nyhet i veien for å nærme seg diskblokkeringsredundans har dukket opp ved California Institute of Technology , som innebærer replikering av blokker ikke innenfor en enkelt server, men mellom flere servere over hele nettverket, som er tydelig for en distribuert RAID. Denne teknikken kalles RAIN (in) for "Redundant Array of Independent Nodes" (eller "Reliable Array of Inexpensive Nodes"), som kan oversettes som "redundant utvalg av uavhengige noder." De viktigste fordelene med denne lagringsarkitekturen er ytelsesnivået og kapasiteten for utvikling.

Referanser

(in) Jakob Østergaard , Emilio Bueso et al. , Programvaren-RAID HOWTO ,6. mars 2010, 1.1.1 utg. , 46 s. ( les online ).
(in) Hva er RAID på Seagate-nettstedet
(i) US patent 4,092,732 innlevert av Norman Ken Ouchi
(in) [PDF] Artikkel som gir RAID
Patrick Schmid, Achim Roos, “ Bygger et RAID 5-system med Windows XP ” , på Digital Age ,4. januar 2005
Linux gir likevel muligheten, med visse begrensninger, å få tilgang til RAID-volumer opprettet under Windows, takket være dmraid-pakken. Se lenken " Bruk semi-hardware RAID "
http://support.dell.com/support/topics/global.aspx/support/kcs/document?docid=577802&DoNotRedirect=y&doclang=FR
“ Lag et enkelt volum ” på technet.microsoft.com .
(in) Standard RAID-nivåer
(in) [PDF] Matematisk RAID 6 , Peter Anvin
(in) InoStor, " nStor Adopts InoStor's Patented Technology RAIDn " på www.businesswire.com/ ,30. november 2004
(i) Axel Boehme, " RAIDn-algoritmen - hvordan sammenligner den seg? " , På StorageSearch.com/ ,6. juli 2004
" Hva betyr RAID (Redundant Array of Independent Disks)?" - Definition IT from Whatis.fr ” , på LeMagIT (åpnet 23. august 2019 )
" Forklaring av ARC og L2ARC" ZFS Build, " på www.zfsbuild.com (åpnet 10. oktober 2015 )
(in) " The Blog of Ben Rockwood "
https://www.synology.com/fr-fr/knowledgebase/DSM/tutorial/Storage/What_is_Synology_Hybrid_RAID_SHR
(in) " Hvorfor RAID 5 slutter å fungere i 2009 " på zdnet
(in) " Freenas maskinvareanbefalinger »
(in) ' Triple-Parity RAID and Beyond " på acm.org
(in) http://www.paradise.caltech.edu/papers/etr029.pdf [PDF]
“ Hva er Redundant Array of Independent noder (regn)? - Definisjon fra Techopedia ” , på Techopedia.com (åpnet 16. august 2020 ) .
(in) Margaret Rouse, " RAIN (redundant / pålitelig utvalg av billige / uavhengige noder) " på techtarget.com ,10. mars 2006(åpnet 16. august 2020 ) .
" Dell utvider sitt lagringstilbud med en objektløsning, DX6000 - Le Monde Informatique " , på Le Monde informatique (åpnet 16. august 2020 ) .
http://www.networkworld.com/news/tech/2004/0209techupdate.html

Se også

Relatert artikkel

mdadm

RAID (IT)

Historisk

Beskrivelse og begreper

RAID / SLED sammenligning

Paritet og overflødighet

De forskjellige typene RAID-systemer

Programvare RAID

Pseudo-hardware RAID

Maskinvare RAID

De forskjellige nivåene av RAID

Standard nivåer

Mindre vanlige RAID-nivåer

Kombinert RAID-nivå

Spesielle RAID-nivåer

Pålitelighet og justeringer av en RAID-installasjon

Valg av kontroller

Kontrollørens overflødighet

Hot plugging ( hotplug / hotswap )

Reserve disker ( reserve / hotspare )

Skjult

Detaljnivå

Mulighetene og grensene for RAID

Hva RAID kan gjøre

Hva RAID ikke kan gjøre

Hvordan RAID kan være et problem

RAID-evolusjoner

Referanser

Se også

Relatert artikkel

Eksterne linker