Den RAID er et sett av teknikker for lagring virtualisering tillater distribusjon av data over flere diskstasjoner for å øke enten ytelsen eller sikkerhet eller feiltoleranse av hele eller systemer.
Den akronym RAID ble definert i 1987 ved University of Berkeley (California), i en artikkel kalt A Case for Redundant Arrays av rimelige disker (RAID) , eller "overflødig gruppering av billige disker". I dag har ordet blitt et akronym for Redundant Array of Independent Disks , som betyr "overflødig gruppering av uavhengige disker". Kostnaden per megabyte harddisker som ble delt med 1 300 000 på 29 år, i dag velges RAID av andre årsaker enn kostnaden for lagringsplass.
I 1978 arkiverte en IBM- ansatt , Norman Ken Ouchi, patent på et "System for gjenoppretting av data lagret i en defekt lagringsenhet", som ble beskrevet som det som senere skulle bli RAID 5 . Dette patentet nevner også skivespegling ( som senere vil bli kalt RAID 1 ), samt beskyttelse med en dedikert paritet (tilsvarende det som senere vil bli kalt RAID 3 eller RAID 4 ).
RAID-teknologi ble først utviklet av en gruppe forskere ved University of California i Berkeley i 1987 . De studerte muligheten for å få to eller flere harddisker anerkjent som en enhet av systemet. Resultatet var et lagringssystem med mye bedre ytelse enn enkle harddisksystemer, men med svært dårlig pålitelighet. Forskerne vendte seg deretter til overflødige arkitekturer for å forbedre feiltoleransen til lagringssystemet.
I 1988 ble de forskjellige RAID-typene 1 til 5 formelt definert av David Patterson, Garth Gibson og Randy Katz i publikasjonen med tittelen " A Case for Redundant Arrays of Inexpensive Disks (RAID) ". Denne artikkelen introduserte begrepet “RAID”, som umiddelbart ble overtatt av disken industrien, og tilbyr fem ulike nivåer eller moduser, hver med sine egne fordeler og ulemper, sammenligner dem til “SLED” ( Enkeltrom Large) modell Dyrt Disk. : se nedenfor).
Siden oppstarten har RAID-arkitekturens viktigste særegenhet vært dens evne til å kombinere flere rimelige og høyteknologiske lagringsenheter i et enkelt utvalg, slik at denne grupperingen gir økt pålitelighet og / eller ytelse, til en mye lavere kostnad enn en enkelt , toppmoderne lagringsenhet med tilsvarende kapasitet. RAID-arkitekturen er derfor i motsetning til SLED-arkitekturen ( Single Large Expensive Disk ), som er basert på bruk av en enkelt harddisk med høy kapasitet og høy ytelse, derfor til en høy pris, fordi den ene - den må ikke bare være i stand til å lagre mye informasjon, men det må også være av utmerket kvalitet for å garantere bærekraft og tilgjengelighet av det ikke-overflødige innholdet.
Faktisk, i en SLED-type arkitektur, er god datalagring avhengig av den minste feil på harddisken. Når en feil oppstår, er ikke bare systemet ubrukelig mens den defekte maskinvaren byttes ut, men den eneste måten å gjenopprette dataene på er å gjenopprette den siste sikkerhetskopien , som kan ta flere timer hvor systemet er nede.
Selv om en slik periode med inaktivitet er akseptabel for en persons datamaskin, er det derimot uoverkommelig for et selskaps datasystem , som en slik feil kan få betydelige konsekvenser for. Bruken av en RAID-arkitektur, i det minste i de fleste funksjonelle nivåer, gjør det mulig å gi et svar på disse behovene, fordi ikke bare feilen på en av diskene i matrisen ikke forstyrrer driften av sammen, noe som tillater systemet skal fortsette å operere, men i tillegg blir innholdet automatisk gjenoppbygd fra de andre stasjonene når den mislykkede stasjonen byttes ut under normal systemdrift. Dermed kan virksomheten i hele hendelsens varighet fortsette uavbrutt og gjennomsiktig.
RAID, avhengig av funksjonelle nivåer, hvis den gir responstider som er identiske med diskene hvis de ble brukt hver for seg, gir betydelig høyere gjennomstrømninger , til og med ved bruk av billige harddisker med gjennomsnittlig ytelse, samtidig som den garanterer høy ytelse. Mye bedre pålitelighet (unntatt for RAID 0 som reduserer den like mye som antall disker - se forklaringer nedenfor). I slike situasjoner er RAID-arkitekturer derfor ideelle, både med tanke på ytelse og pålitelighet . I alle fall fortsatt helt transparent for brukeren som, uavhengig av antall fysiske disker brukes til å bygge RAID, vil bare noen gang se en eneste stor logisk volum, som han vil få tilgang på en svært vanlig måte RAID. Gjennom drifts systemet .
Speiling viser seg å være en kostbar løsning, siden det er nødvendig å skaffe lagringsenhetene i flere eksemplarer, for å ha tilgjengelig bare en brøkdel av den totale kapasiteten (vanligvis halvparten). Med utgangspunkt i prinsippet om at flere lagringsenheter har lav sannsynlighet for å mislykkes samtidig, har andre systemer blitt designet, inkludert de som gjør det mulig å regenerere de manglende dataene fra dataene som er tilgjengelige og fra tilleggsdata, kalt redundans .
Det enkleste og mest brukte redundanssystemet er paritetsberegningen . Dette systemet er basert på den logiske operasjonen XOR (eksklusiv OR) og består i å bestemme hvorvidt antall bits i tilstanden er jevn eller merkelig på de aktuelle databitene . Hvis antall er like, er paritetsbiten verdt . Hvis antallet er odd, er paritetsbiten verdt . Når en av de således dannede databitene blir utilgjengelig, er det da mulig å regenerere den manglende biten ved å bruke den samme metoden igjen på de gjenværende elementene. Denne teknikken brukes i RAID 5-systemer.
Det er mer komplekse redundanssystemer som kan generere flere redundanselementer for å støtte fraværet av flere elementer. RAID 6 bruker for eksempel en teknikk for paritetskalkylering basert på polynomer .
RAID-systemet er:
RAID-systemet er derfor i stand til å administrere distribusjonen og konsistensen av disse dataene på en eller annen måte. Dette kontrollsystemet kan være rent programvare eller bruke dedikert maskinvare.
I RAID-programvare er kontrollen av RAID fullstendig sikret av et programvarelag i operativsystemet. Dette laget settes inn mellom hardware-abstraksjonslaget (driver) og filsystemlaget.
fordelerDe fleste operativsystemer allmennheten allerede brukes til å implementere programvare RAID, det være seg Windows , ulike Linux-distribusjoner , eller Mac OS X .
RAID- er for Microsoft Windows og Linux- programvare er inkompatible med hverandre .
De aller fleste rimelige RAID-kontrollere som er innebygd i mange hovedkort siden 2004/2005, støtter RAID 0 og 1 på IDE- eller SATA- harddisker . Til tross for markedsføringsdiskursen på den tiden som pleide å villede systematisk på dette punktet, er det ikke strengt tatt hardware RAID, men snarere en diskkontroller med noen avanserte funksjoner. Fra et strengt maskinvareperspektiv er denne hybridløsningen ikke forskjellig fra RAID-programvaren. Det er imidlertid forskjellig i plasseringen av programvarerutinene for å administrere RAID.
Med nyere maskinvare er forskjellen mellom pseudo-hardware RAID og hardware RAID rent teoretisk. Den eneste praktiske forskjellen er at i pseudo-hardware RAID er ikke prosessor og minne dedikert. Imidlertid betyr kraften til nyere prosessorer og de reduserte minnekostnadene at denne begrensningen ikke lenger er et kritisk element. Den eneste gjenværende fordelen for spesialisert RAID er å tilby mer effektive verktøy for hendelsesadministrasjon.
fordelerBortsett fra denne viktige fordelen, kombinerer denne typen RAID ulempene med de to andre tilnærmingene:
I tilfelle hardware RAID tildeles et kort eller en komponent for å administrere operasjoner. RAID-kontrolleren kan være intern i sentralenheten (utvidelseskort) eller deporteres i en lagringsplass .
En raid-kontroller er vanligvis utstyrt med en bestemt prosessor, dedikert minne, muligens et reservebatteri, og er i stand til å administrere alle aspekter av RAID-lagringssystemet takket være innebygd mikrokode ( firmware ).
Fra et operativsystemperspektiv gir RAID-kontrolleren full virtualisering av lagringssystemet. Operativsystemet behandler hvert RAID-volum som et enkelt lagringsvolum og har ingen kjennskap til dets fysiske bestanddeler.
fordelerDe forskjellige typene RAID-arkitektur er nummerert fra 0 og kan kombineres med hverandre (vi snakker da om RAID 0 + 1, 1 + 0 osv.).
RAID 0: stripet volumRAID 0, også kjent som “disk striping” eller “ striping volume” , er en RAID-konfigurasjon som øker ytelsen til arrayet betydelig ved å få harddisker til å fungere parallelt (med ).
Kapasitet Den totale kapasiteten er lik den for det minste elementet i klyngen multiplisert med antall elementer som er tilstede i klyngen, da stripesystemet vil sette seg fast når den minste disken er full (se diagram). Overflødig plass til de andre elementene i klyngen forblir ubrukt. Det anbefales derfor å bruke disker med samme kapasitet. Pålitelighet Ulempen med denne løsningen er at tap av en enkelt lagringsenhet resulterer i tap av alle data på RAID-volumet. Koste I en RAID 0, som ikke gir noen redundans, brukes all tilgjengelig diskplass (forutsatt at mediene har samme kapasitet).I denne konfigurasjonen distribueres dataene i striper av fast størrelse. Denne størrelsen kalles granularitet (se delen Granularitet nedenfor).
Eksempel Med en RAID 0 som har en stripestørrelse på 64 kiB og består av to disker (disk Disk 0 og disk Disk 1 ), hvis vi vil skrive en fil A på 500 kiB, blir filen delt inn i 8 striper (bil ). La oss kalle dem 1, 2, 3, 4, 5, 6, 7 og 8. De vil bli fordelt på alle diskene som følger: Disk 0: 1, 3, 5, 7 Disk 1: 2, 4, 6, 8 Dermed kan skrivingen av filen utføres samtidig på hver av diskene i en tid som tilsvarer skrivingen på 256 kiB, noe som tilsvarer en dobling av skrivehastigheten.Således, på en RAID 0 av disker (med ), må hver disk bare lese og skrive data, noe som har den effekt at tilgangstidene (lesing og skriving) til dataene reduseres. Ettersom diskene deler arbeidet, akselereres behandlingen.
BrukerDenne typen RAID var perfekt for applikasjoner som krever rask behandling av store datamengder med harddisker. Men denne arkitekturen gjør ingenting for å sikre datasikkerhet. Dette er fordi hvis en av stasjonene mislykkes, går alle dataene på RAID-volumet tapt.
RAID 0 ble brukt i datamaskiner, i applikasjoner som krever store dataoverføringer ( videoredigering ...), snarere enn i NAS .
Den kan brukes til å øke båndbredden til en server som krever lagringsmedier som er i stand til å støtte veldig store mengder skriving.
Merk : i hardware RAID er det sjelden mulig å migrere fra en RAID 0 med flere disker til en RAID 1, mens det motsatte er sant. Det er derfor mer fleksibelt å starte i RAID 1.
RAID 1: Speilvendte diskerRAID 1 er bruk av overflødige disker (med ) hver disk som inneholder klyngen til enhver tid nøyaktig de samme dataene, derav bruken av "speil" ( speiling engelsk).
Kapasitet Den totale kapasiteten er lik den for det minste elementet i klyngen, med overflødig plass til andre elementer i klyngen forblir ubrukt. Det anbefales derfor å bruke elementer med identisk kapasitet. Pålitelighet Denne løsningen tilbyr et utmerket nivå av databeskyttelse. Det fungerer så lenge det er minst en funksjonell disk igjen. Koste Lagringskostnadene er høye og direkte proporsjonale med antall brukte speil, mens den brukbare kapasiteten forblir uendret. Jo høyere antall speil, jo mer øker sikkerheten, men jo mer blir kostnadene uoverkommelige.Lesetilgang til operativsystemet gjøres på den lettest tilgjengelige disken på den tiden. Skriver til matrisen gjøres samtidig til alle diskene, slik at enhver disk til enhver tid kan byttes ut.
Når en av stasjonene svikter, deaktiverer RAID-kontrolleren (gjennomsiktig for datatilgang) den krenkende stasjonen. Når den defekte disken er byttet ut, rekonstruerer RAID-kontrolleren speilet, enten automatisk eller ved manuell inngrep. Når den er synkronisert, går RAID tilbake til sitt opprinnelige redundansnivå.
Merk : migrering fra RAID 1 til RAID 0, RAID 5, RAID 6 er nesten alltid mulig, noe som gjør RAID 1 til en god startløsning hvis det ikke er noe betydelig ytelseskrav.
RAID 5: stripete volum med distribuert paritetRAID 5 kombinerer metoden for stripete volum ( striping ) til en distribuert paritet. Dette er et overflødig sett . Pariteten, som er inkludert i hver skriving, fordeles sirkulært på de forskjellige diskene. Hvert bånd består derfor av datablokker og en paritetsblokk. I tilfelle svikt i en av diskene i matrisen, vil det for hvert bånd enten mangle en datablokk eller paritetsblokk. Hvis det er paritetsblokk, er det greit, fordi ingen data mangler. Hvis det er en datablokk, kan innholdet beregnes fra de andre datablokkene og paritetsblokken. Dataintegriteten til hvert bånd er bevart. Så ikke bare er klyngen fortsatt i orden, men det er også mulig å gjenoppbygge disken når den er byttet ut fra data- og paritetsinformasjonen på de andre diskene.
Vi kan derfor se at RAID 5 støtter tap av bare en disk om gangen, noe som blir et problem siden diskene som utgjør en klynge blir stadig større (1 TB og mer), fordi tid gjenoppbygger paritet i tilfelle en mislykket disken forlenges (noe som øker sannsynligheten for at en ny feil oppstår fordi andre harddisker er under tung belastning under ombyggingen). Dermed er rekonstruksjonstiden vanligvis rundt 2 timer for 300 GB disker mot rundt ti timer for 1 TB . For å begrense risikoen er det vanlig å legge til en ekstra stasjon ( reserve ), dedikert til øyeblikkelig erstatning av en mulig mislykket stasjon: i normal drift er den ubrukt; i tilfelle en disksvikt, tar den automatisk plassen til den mislykkede disken. Dette krever en fase som ofte kalles paritetsrekomputering, som består i å gjenskape den manglende blokken (data eller paritet) på hver nye bånd på den nye disken. Under paritetsberegningsprosessen forblir RAID-volumet normalt, datamaskinen taper bare litt.
Praktisk eksempel: Vurder fire harddisker A, B, C og D, av samme størrelse. Systemet vil distribuere de første blokkene på diskene A, B og C som i RAID 0-modus ( striping ), og på disk D, resultatet av den eksklusive ELLER- operasjonen mellom de andre diskene (her A xor B x eller C). Den vil distribuere følgende blokker på diskene D, A og B, deretter pariteten (dvs. D xeller A x eller B) på disk C, og så videre ved å bytte diskene sirkulært, ved hver blokk. Pariteten fordeles deretter over alle diskene.I tilfelle en disksvikt, kan dataene på den gjenopprettes ved hjelp av xor. Faktisk har XOR-operasjonen ( ) følgende egenskap: vurderer blokker av samme størrelse, og i så fall og generelt . Det vil si at enhver datablokk som går tapt på grunn av en mislykket disk på en RAID 5- diskstasjon, kan gjenopprettes med kontrolldatablokken. Vi ser derfor at hvis vi ønsker å skrive i en blokk, må vi:Dette systemet krever absolutt minst tre harddisker. Disse skal generelt være av samme størrelse, men mange moderne RAID-kort tillater stasjoner av forskjellige størrelser, selv om dette ikke er optimalt. Den faktiske nyttige lagringskapasiteten for et system med identisk kapasitet er . Hvis det brukes disker med ulik kapasitet, vil systemet bruke minimumskapasiteten i forrige formel. For eksempel tilbyr tre 100 GB- disker i RAID 5 200 GB nyttige; ti disker, 900 GB nyttige.
Dette systemet kombinerer sikkerhet (takket være paritet) og god tilgjengelighet (takket være fordelingen av paritet), selv i tilfelle feil på en av lagringsenhetene.
Det er en variant: "Variable RAID 5" hvor hver disk har sin egen kontroll. Alle andre funksjoner er de samme.
Vi har ofte en tendens til å tro at et RAID 5-system er helt pålitelig. Det er faktisk generelt akseptert at sannsynligheten for samtidig feil på flere disker er ekstremt lav - vi snakker åpenbart om en feil som resulterer i fullstendig og permanent tap av tilgang til dataene til flere disker og ikke om en enkel utilgjengelighet av flere disker ... Dette gjelder for en generell feil på en diskstasjon. Dette er imidlertid feil hvis vi ser på som en fiasko en enkelt sektor som har blitt uleselig.
I praksis er det veldig sjelden at alle dataene i et volum blir lest regelmessig. Og selv om dette er tilfelle, blir konsistensen av pariteten bare sjelden sjekket av ytelsesgrunner. Det er derfor sannsynlig at feil som uleselige paritetssektorer vil bli oppdaget i veldig lang tid. Når en av diskene blir virkelig defekte, krever ombygging å gå gjennom alle de gjenværende diskene. Vi kan da oppdage feil som hadde vært usynlige til da.
Alt dette er kanskje ikke alvorlig og resulterer i tap av en minimal datamengde (en disksektor i dette eksemplet er vanligvis 512 byte), men de aller fleste RAID-kontrollere klarer ikke å håndtere delvise feil. Generelt som "mislyktes "en disk som inneholder en enkelt uleselig sektor. Så hvis en harddisk mislykkes, mens det oppstår en uleselig sektor på tidspunktet for ombyggingen, anses to stasjoner å mislykkes samtidig, og RAID 5-volumet blir ubrukelig. Det blir da vanskelig og dyrt å gjenopprette ikke lagrede data.
Et RAID 5-system må derfor kontrolleres og sikkerhetskopieres med jevne mellomrom for å sikre at det ikke er noen risiko for et slikt tilfelle.
NRAID: Nær / ikke overflødig matrise av billig / uavhengig disk
Disk sammenkobling er prosessen med å legge til kapasiteten til flere harddisker i et logisk volum som er lik størrelse med summen av størrelsene på harddiskene. Denne metoden bruker en sekvensiell skrivemetode: data skrives bare til neste harddisk når det ikke er plass igjen på den forrige.
NRAID er ikke strengt tatt en RAID, og den tillater ikke dataredundans. Svikt i en stasjon kan ha katastrofale konsekvenser for resten av dataene hvis kritiske metadata blir påvirket.
Noen ganger forveksles det feilaktig med JBOD , som angir et lagringssystem som grupperer sammen individuelt tilgjengelige stasjoner uten spesiell konfigurasjon.
NRAID er også referert til som "Simple Volume" under Windows (fra Windows 2000).
RAID 2: stripet volum ved paritetRAID 2 er nå foreldet. Den kombinerer RAID 0 (striped volume) -metoden med å skrive en Hamming-kode feilkontrollkode (ECC-kode) til en egen harddisk. Imidlertid er skrivingen av denne kontrollkoden nå direkte integrert i harddiskstyringene. Denne teknologien gir et godt sikkerhetsnivå, men dårlig ytelse.
RAID 3 og RAID 4RAID 3 og RAID 4 er like bortsett fra at førstnevnte opererer i byte og sistnevnte i blokker. RAID 4 krever ikke så mye synkronisering mellom diskene. RAID 3 har derfor en tendens til å forsvinne til fordel for RAID 4 som gir betydelig høyere ytelse.
Disse RAID-nivåene krever en diskmatrise (med ). De første diskene inneholder dataene mens den siste disken lagrer pariteten (se paritetsavsnitt ).
Det er viktig at paritetsdisken har god kvalitet, fordi den hele tiden er under stress for skriving. Dette siste punktet er en av begrensningene ved RAID 3.
På samme måte, hvis mer enn en stasjon mislykkes, kan tap av data ikke utbedres.
RAID 6RAID 6 er en utvikling av RAID 5 som øker sikkerheten ved å bruke overflødig informasjon i stedet for en. Den tåler derfor disksvikt . De matematiske grunnlagene som brukes til redundansinformasjonen for RAID 6 er mye mer komplekse enn for RAID 5; Derfor er implementeringene av algoritmen ofte begrenset til (dvs. tap av to disker).
Hvis sikkerheten er større, er materialkostnaden høyere og hastigheten lavere. CPU-kraften som kreves for å beregne permitteringer og spesielt å gjenoppbygge et defekt volum er også betydelig større.
De største feilene er:
RAID 6 ble lite brukt på grunn av merkostnaden. Imidlertid har økningen i harddiskkapasiteten de siste årene, samt populariseringen av profesjonelle løsninger basert på SATA-disker, vekket ny interesse for bruk av RAID 6, enten gjennom RAID-kontrollere for maskinvare eller via maskinvare. Software RAID (Linux 2.6-kjernen inkluderer RAID 6).
Den totale brukbare kapasiteten ( ) for et system med disker reservert for redundans er ( = kapasiteten til den minste harddisken).
Interessante, men litt vanskelige forklaringer er tilgjengelige i den engelske versjonen av denne artikkelen, så vel som i The Mathematics of RAID 6 .
RAIDnEt patentert lagringssystem kalt RAIDn hevder å overgå kapasitetene til RAID 6.
RAID DPRAID DP ( Dual Parity ) ligner RAID6 bortsett fra at i RAID DP er paritetsskivene faste. Denne typen RAID blir vanligvis brukt på NAS- lagringsservere . NetApp- selskapet bruker denne teknologien.
I utgangspunktet er et kombinert RAID-nivå bruk av et klassisk RAID-konsept på byggesteiner som i seg selv er resultatet av et klassisk RAID-konsept. Konseptet som brukes kan være likt eller annerledes.
Syntaksen er fremdeles litt uklar, men det første tallet kan generelt betraktes som en indikasjon på nivået på “klynger” raid og det andre som indikerer det totale RAID-nivået. I absolutte termer hindrer ingenting å forestille seg kombinert RAID med 3 eller flere trinn, men for øyeblikket forblir dette mer av teorien og eksperimenteringen.
Det store (og økende) antall mulige permutasjoner betyr at det er et mangfold av kombinerte RAID-er, og vi vil ikke gjøre en omfattende oversikt. Vi kan imidlertid presentere fordeler og svakheter ved de vanligste.
For følgende beregninger brukes følgende variabler:
Feilterskelene vist nedenfor angir minimum antall mislykkede stasjoner som kan føre til at hele RAID mislykkes (det vil si at under dette antallet mislykkede stasjoner på RAID-volumet i prinsippet ikke kan være feil). I praksis er det mulig at et RAID-volum med mer enn dette antallet mislykkede stasjoner fortsatt vil fungere, men det anbefales at du bytter ut de mislykkede stasjonene så snart som mulig.
RAID 01 (eller RAID 0 + 1)Det gjør det mulig å oppnå rask speiling siden den er basert på stripete klynger (RAID 0) kombinert i speiling (RAID 1). Siden hver klynge inneholder minst to elementer, og det kreves minst to matriser, kreves det minst fire lagringsstasjoner for å opprette et RAID 0 + 1-volum.
Påliteligheten er gjennomsnittlig fordi en mislykket disk fører til at hele matrisen som inneholder den mislykkes. I tillegg forlenger dette gjenoppbyggingstiden betydelig og forringer ytelsen under ombygging, siden alle diskene er stresset. Hovedfordelen er at når det gjelder et speil med tre eller flere klynger, gjør frivillig fjerning av en hel klynge det mulig å ha en øyeblikkelig sikkerhetskopi uten å miste redundansen.
Total kapasitet: Topphastighet : Feilterskel: disker RAID 10 (eller RAID 1 + 0)Det gjør det mulig å oppnå et samlet volum per bånd med et godt nivå av pålitelighet (siden det er basert på replikerte klynger). Siden hver klynge inneholder minst to elementer og det kreves minimum to matriser, kreves det minst fire lagringsstasjoner for å opprette et RAID 1 + 0-volum.
Dens pålitelighet er ganske høy, siden alle elementene i en klynge må være defekte for å forårsake en total feil. Rekonstruksjonen er ganske effektiv siden den bare mobiliserer diskene til en enkelt klynge og ikke alle.
Total kapasitet: Topphastighet : Feilterskel: disker RAID 10 vs. RAID 6For hjemmeservere som ofte er begrenset til fire disker, virker valget mellom RAID 6 og RAID 10 (eller 1 + 0) problematisk: i begge tilfeller har vi halvparten av den totale diskplassen viet redundans. RAID 6 tar fordelen utover det, da den ikke lenger bruker halvparten av plassen. RAID 6 tolererer også to feil i samme tidsperiode (for eksempel feil på en disk mens du bygger om en annen). Hvis RAID 10 imidlertid fortsatt er foretrukket, er det fordi den er mer reaktiv (mye mindre beregninger på farten er nødvendig) og tillater mye raskere rekonstruksjoner.
RAID 05 (eller RAID 0 + 5)Samme prinsipp som for 0 + 1 raid, men bruk RAID 5 for den globale delen. Siden hver matrise inneholder minst to disker, og det kreves minimum tre matriser, kreves det minst seks lagringsstasjoner for å opprette et RAID 0 + 5-volum. Denne modusen er ikke av stor interesse sammenlignet med en vanlig RAID 5 med disker, og brukes derfor veldig lite.
Total kapasitet: Maksimal hastighet: (denne formelen forsømmer paritetskalkulasjonstidene) Feilterskel: disker RAID 15 (eller RAID 1 + 5)Det gir et stripet volum med veldig pålitelig distribuert redundans (siden det er basert på speilede klynger). Hver klynge som inneholder minst to disker, og det er nødvendig med minst tre matriser, krever minst seks lagringsenheter for å opprette et RAID 15.-volum. Denne modusen er veldig pålitelig siden alle diskene i to forskjellige matriser må stoppe. For å fungere for sett det som standard. Denne modusen er imidlertid dyr i forhold til oppnådd kapasitet.
RAID 50 (eller RAID 5 + 0)Det gir et stripet volum basert på RAID 5. Ettersom hver klynge inneholder minst tre disker, og det kreves minimum to matriser, kreves det minimum seks lagringsenheter for å lage et RAID 5 + 0-volum. Et av de beste kompromissene når du leter etter fart uten å ønske å forringe påliteligheten for mye. Dette fordi det (skjøre) båndaggregatet er basert på overflødige klynger. Det er imidlertid tilstrekkelig at to disker i samme klynge ikke klarer å få den til å mislykkes.
Total kapasitet: (i dette tilfellet er N det totale antallet disker og ikke per klynge) Maksimal hastighet: (denne formelen forsømmer paritetskalkulasjonstidene) Feilterskel: disker RAID 51 (eller RAID 5 + 1)Det gjør det mulig å oppnå et replikert volum basert på RAID 5-arrays. Hver klynge som inneholder minst tre disker, og minst to arrays er nødvendig, det kreves minst seks lagringsenheter for å lage et RAID 5 + 1-volum. Det er en kostbar modus (lav kapasitet sammenlignet med antall disker).
Total kapasitet: Maksimal skrivehastighet: (denne formelen forsømmer paritetskalkulasjonstidene) Maksimal lesehastighet: (denne teoretiske formelen forutsetter maksimal optimalisering som aldri blir nådd) Feilterskel: diskerRAID 5E (E for Enhanced ) er en variant av RAID 5 der reservebånd er reservert. Disse båndene fordeles over diskene på en sirkulær måte, i likhet med paritet.
RAID 5EERAID 5EE er en variant av RAID 5E som gir bedre ombyggingstider. I motsetning til RAID 5E fordeles ledig plass reservert i matrisen på alle fysiske disker.
5DP RAIDRAID 5DP ( Dual Parity ) ligner RAID 6, bortsett fra at i RAID DP er de to paritetsplatene faste. Denne typen RAID blir vanligvis brukt på NAS-lagringsservere .
RAID TPRAID TP for Triple Parity RAID-teknologi har samme organisasjon som RAID 6, men bruker tre redundanskoder. Dette gjør at operasjonen kan fortsette etter samtidig svikt i tre stasjoner.
Dobbel paritetDouble parity RAID er designet for å forbedre beskyttelsen av data som er lagret på en gruppe disker mot samtidig svikt i to volumer, der RAID-nivå 3, 4 og 5 bare beskytter mot tap av ett volum. For disse er dataene som skal lagres fragmentert i blokker som skrives til flere disker mens en paritet av disse blokkene beregnes. I tilfelle tap av en av diskene, er denne pariteten resultatet av en matematisk operasjon slik at blokkene som er lagret på de andre diskene og pariteten tillater at data rekonstrueres . Denne pariteten er enten skrevet på en egen disk (RAID 3 og 4), eller distribuert mellom diskene i gruppen (RAID 5). Men hvis to stasjoner mislykkes, går alle lagrede data tapt. For å beskytte mot denne muligheten har flere modeller av dobbel paritet RAID dukket opp: RAID 6, RAID-DP, RAID-ADG, RAIDn ... Alle er basert på det samme prinsippet: to pariteter beregnes og lagres, dvs. på to dedikerte disker. , eller på en distribuert måte på diskene i klyngen. På denne måten er matrisen beskyttet mot samtidig tap av to disker.
RAID 1.5RAID 1.5 er en utvikling av RAID 1. Lesetilgang gjøres ikke lenger fra en enkelt disk, men parallelt fra alle diskene på samme måte som en RAID 0 (men bare når du leser) som gir en gevinst som er følsom i ytelse, uten å endre påliteligheten.
RAID 7, RAID ADGUtviklingen av RAID 3 gjør det mulig å betjene alt asynkront . Det har blitt annonsert som 1,5x til 6x bedre enn noen annen RAID . Akkurat som RAID 3 inneholder en enkelt disk paritetene til alle. Hver disk har en SCSI / SATA / Fibre Channel- kontroller ... og systemet styres av et kort som beregner paritet, administrerer hurtigbufferen og styrer diskene .
Denne konfigurasjonen, utviklet av Storage Computer Corporation, er proprietær og er veldig kostbar å sette opp.
IBM ServeRAID 1ERaid 1E er et tape- speilingssystem som tillater bruk av et antall disker som er større enn to, like eller odde. Dataene kuttes i strimler som dupliseres ( speiles ) på en av de andre diskene i matrisen. Den totale kapasiteten til det logiske volumet er halvparten av det fysiske volumet.
Matrix RAIDDen Intel Matrix Storage Technology er tilgjengelig fra chipset (brikkesett) og ICH6R ICH6RW (2005). Dette er en RAID-løsning basert på 4 Serial-ATA-porter som vil gjøre det mulig å gruppere harddisker i RAID på en mindre restriktiv måte enn dagens løsninger. Faktisk, med to identiske disker, tillater nåværende RAID-kontrollere bare RAID 0 eller RAID 1. Matrix RAID tillater å kombinere, på bare to disker, både RAID 0 og RAID 1. interesse er ikke umiddelbart åpenbar, men for eksempel med to harddisker på 250 GB , er det mulig å lage en RAID 0 ( striping ) på 100 GB (de første 50 GB på hver disk) med rask tilgang, dedikert til systemet, og en 200 GB RAID 1 ( speiling ) sikret med de resterende 400 GB , for lagring av brukerdata. Med tradisjonelle RAID-systemer krever integrering av RAID 0 og RAID 1 i en enkelt konfigurasjon bruk av minst fire disker. Selv om det er åpenbart, la oss legge til at ICH6R ikke tillater å lage RAID 01 eller 10 med bare to harddisker.
Opp til ICH8R / DO er det mulig å gjøre et RAID 5 maksimum med fire disker. Fra ICH9R / DO er det mulig å lage en RAID 5 av seks disker, noe som betydelig øker den tilgjengelige kapasiteten. I tillegg er det med ICH9 / 10 DO mulig å legge til en disk i en eksisterende klynge.
RAID SDenne proprietære erstatningsmetoden for EMC Symmetrix- løsninger gjør det mulig å implementere en stripet paritet RAID-matrise. Det brukes ikke lenger på nåværende utstyr. Mens RAID S ser ut som RAID 5, har den noe forbedret ytelse, inkludert den som tilbys ved å ha en hurtig hurtigbuffer på batteriet.
Sun RAID-ZSuns ZFS- system inneholder et redundansskjema som ligner på RAID 5 som kalles RAID-Z. RAID-Z unngår “ skrivehullet” til RAID 5 ved en kopi-på-skriv-regel: i stedet for å skrive over gamle data med nye data, skriver den nye data på et nytt sted og skriver om pekeren til de nye dataene. Dette unngår lesemodifiser-skriv-operasjoner for små poster ved bare å gjøre full-strip- skrivinger . Små blokker skrives i speil i stedet for å være paritetsbeskyttet, noe som er mulig fordi filsystemet er klar over lagringsunderstrukturen og kan tildele ekstra plass om nødvendig . Det er også en RAID-Z2 og en RAID-Z3 som bruker dobbel og trippel paritet. De tillater å miste opptil henholdsvis to og tre stasjoner uten å miste data.
Dette systemet løser også problemene med stille korrupsjon av RAID 5 takket være skrubbeoperasjoner som analyserer alle dataene i klyngen for å oppdage uoverensstemmelser.
RAID-Z-systemet er mindre effektivt enn RAID 5: hver lese- eller skrivetilgang som har tilgang til alle diskene, gjør det ikke mulig å utnytte multiplikasjonen av lesehoder. På den annen side tillater det bruk av RAM-minne som cache (ARC). Det er også mulig å vie SSD-er til rollen som lese-cache (L2ARC) eller skrive cache (ZIL) for å forbedre ytelsen til en klynge.
Synology Hybrid Raid (SHR)Synologys proprietære teknologi relatert til RAID-systemet, som simulerer driften av en RAID 5 ved å akseptere disker av forskjellige størrelser samtidig som ubenyttet plass minimeres.
X-RAID (NetGear)X-RAID-systemet er en teknikk utviklet av Netgear på sin ReadyNAS-serie med produkter. Avhengig av antall disker kan du velge mellom de forskjellige RAID-typene og bytte fra den ene til den andre uten tap av data eller nedetid. X-RAID bruker hovedsakelig RAID 1 og 5.
De fleste nåværende hovedkort har en integrert RAID-kontroller. Det er alltid best å velge en kontroller som er tilordnet denne oppgaven. I tillegg til det valgte grensesnittet, er hurtigminnet til den dedikerte kontrolleren en viktig faktor i ytelsen til RAID-systemet.
En parameter du må huske på når du designer en RAID, er antall grensesnitt som styrer diskene ( IDE , SCSI , SATA eller SAS- kort ). Faktisk er RAID-kontrolleren et viktig element for driften av helheten; hvis det mislykkes, forårsaker det utilgjengeligheten av alle elementene i RAID.
Hvis dette punktet anses som avgjørende, er det mulig å løse dette problemet ved å bruke mer enn en kontroller. For eksempel, i tilfelle av en enkel programvare RAID 1 basert på bruk av IDE- disker , anbefales det å koble hver harddisk til en annen kontakt på hovedkortet. I mer komplekse tilfeller, spesielt når du bruker en ekstern diskboks, er det mulig å legge til en eller flere overflødige bukter, noe som gjør det mulig å ikke bare kompensere for mangelen på en av dem, men også å utføre en belastningsbalansering ( lastbalansering ) , som forbedrer ytelsen betydelig, spesielt unngår flaskehalser når det gjelder båndbredde .
Den snakker voldelig om plater som kan plugges hot ( hotplug / hotswap engelsk), mens det i virkeligheten er systemmatrisen, og kontrolleren må være utformet slik at du kan fjerne eller sette inn harddisker mens systemet er på.
Denne funksjonen er ikke tilgjengelig med alle teknologier:
Dette tillater:
Bruken av varmekoblingssystemer gjør det derfor mulig å unngå nedetid under en vedlikeholdsoperasjon.
Reserve disker ( reserve / hotspare på engelsk) begrenser sårbarheten til en RAID-løsning.
En ekstra disk er tilordnet en RAID-enhet, men brukes ikke daglig. Det kalles en reservestasjon. Når en stasjon i matrisen mislykkes, tar reserveenheten over og automatisk over. Denne disken blir deretter gjenoppbygd fra dataene som er tilstede på de andre diskene, noe som kan ta flere timer, avhengig av datamengden. Etter ombygging av stasjonen, går systemet tilbake til et optimalt nivå av sikkerhet og ytelse.
Når reservedisken har blitt tatt i bruk, må den mislykkede disken byttes fysisk mot en ny disk som kan fungere som en ny reservedisk.
Den cache er en RAM -minne som brukes til å lagre informasjon som skal leses eller skrives til RAID. Denne bufferen har mye bedre ytelse enn disker (vanligvis over 10 000 ganger raskere), og lar systemet lese eller skrive en serie med informasjon og deretter gå videre til en annen oppgave mens array-kontrolleren slår seg av. Oppgave å "avstakke" operasjonene som skal gjennomføres. Cachen har derfor en veldig viktig positiv innflytelse på systemets totale ytelse.
Lesecache eller "read cache" er et minne der dataene som systemet trenger er forhåndslastet. Driften av den er kompleks i den grad kontrolleren ikke har noen sikkerhet for avlesningene som vil bli bedt om av den, den gir bare ytelsesgevinst hvis spådommen viser seg å være nøyaktig. Data som leses faller oftest i to kategorier: sekvensiell lesing av data og gjentatt tilgang til de samme dataene. Flertallet av lest cacher er derfor basert på den ene siden på bevaring i RAM-minne av dataene som nylig er skrevet eller lest, og på den andre siden på en lesing av følgende data i tilfelle der en sekvensiell lesing nettopp har blitt utført viktig. Størrelsen på lese-hurtigbufferen og egnetheten til predikatsystemet Har veldig stor innvirkning på leseytelsen.
Skrivecache er en buffer der data som skal skrives til disker plasseres før de overføres til dem. Når den ikke er full, det vil si når datamengden som skal skrives ikke overstiger cache-størrelsen, kan systemet sende dataene som skal skrives veldig raskt og utføre andre oppgaver mens kontrolleren er ansvarlig for fysisk skriving til diskene. Skrivecachen øker derfor systemets skriveytelse. Imidlertid, når det gjelder skrivinger der volumet overstiger kapasiteten til hurtigbufferen, må systemet vente til skrivebufferen tømmes før det kan sende mer data. Akseleratoreffekten av hurtigbufferen blir da nesten null, eller til og med negativ på noen kontrollere.
Skrivecaching utgjør en betydelig bekymring for sikkerheten. Faktisk er hurtigbufferminnet som er ustabilt, dataene som er skrevet av systemet i dette minnet, men som ennå ikke er blitt overført til lagringsmediet, tapt i tilfelle strømbrudd eller annen feil. Det kan føre til svært mye tap eller ødeleggelse av data. I noen alvorlige tilfeller kan filsystemets integritet påvirkes, og hele volumet kan bli uleselig. For å løse dette problemet, anbefales det at du ikke aktiverer skrivecaching hvis maskinen får strøm via en omformer og hvis RAID-kontrolleren har en backup av batteriet (dette batteriet holder innholdsbufferen i 30 minutter til 6 timer, avhengig av kontrollermodeller og batteristørrelse).
Merk: Bare ekte “hardware RAID” -kontrollere har hurtigminne. For andre kan programvareekvivalenter ta plass til hurtigbufferen.
Granularitet gjelder bare RAID-typer som bruker datastriper. Disse er i utgangspunktet RAID 0 og RAID 5 nivåer, i tillegg til kombinasjonene med andre nivåer, for eksempel raid 10 eller raid 15.
Dette er faktisk størrelsen på databåndene. Denne konfigurerbare størrelsen er vanligvis et multiplum på 512 byte (størrelsen på en sektor). I praksis varierer det vanligvis fra 16 KB til 1 MB . På de fleste RAID-kontrollere er standardverdien 64 kB . Denne standard granulariteten er vanligvis avveien som oppnår best ytelse i de fleste tilfeller. I svært spesifikke brukstilfeller kan det imidlertid være nødvendig å endre det.
Merk : Å bedømme hensiktsmessigheten av disse endringene og innvirkning på ytelsen krever en grundig forståelse av det indre arbeidet til stasjoner, RAID-kontrolleren og filsystemet. Når det er mulig, anbefales det å bruke standardverdien til RAID-kontrolleren.
RAID fritar deg ikke for å utføre vanlige sikkerhetskopier. Dette er fordi flere stasjonsfeil er vanligere enn du kanskje tror (se avsnittet RAID 5 ovenfor). I tillegg ender menneskelige feil (filsletting / korrupsjon) alltid. Et klassisk eksempel på samtidig svikt på flere disker er følgende: en første disk er offer for en hodelanding, og forårsaker forvridning av en del av platene; men platen som fortsetter å rotere begynner å varme seg opp og når en temperatur som er upraktisk for naboene ... Det skal forstås at en av platene som ligger ved siden av den i sin tur kan mislykkes på grunn av for høy lokal temperatur.
I tillegg, ettersom størrelsen på diskene fortsetter å vokse, vil en RAID som overstiger de nyttige 12 TB (RAID 5 med fire fire TB- disker for eksempel) sannsynligvis være umulig å bygge om igjen, fordi man når pålitelighetsgrensen for SATA-kontrollere (unntatt høy -end serverkontroller): Det vil være statistisk nesten sikkert at en lese / skrive-feil vil oppstå under ombygging. Dette vil også være gyldig for RAID-Z.
RAID har en tendens til å gjøre brukerne overtillit. Denne overdreven tilliten til en teknologi, selv om den er veldig robust og veldig pålitelig i prinsippet, kan føre til katastrofer. Å multiplisere antall disker øker risikoen for feil. I tillegg er diskene som brukes av et RAID-utvalg ofte av samme type og alder, og vil derfor ha en lignende levetid. Derfor kan det være lurt å bruke plater som er av samme modell, men ikke den samme serien (i tilfelle en bestemt serie blir funnet å være defekt). Kompleksiteten til RAID-systemet tilfører teknologiske risikoer: sjeldne, men mulige funksjonsfeil i RAID-kontrolleren eller programvaren er fryktet. En defekt disk kan også forstyrre driften av kontrolleren, logisk eller elektrisk, noe som kan føre til tap av flere stasjoner; i tilfelle en gjentatt feil, er det totale tap av en klynge eller til og med hele lagringsenheten mulig.
Det bør også huskes at bruk av RAID-lagringsenhet ikke gir noen beskyttelse mot:
Det er derfor ikke rimelig å ha full tillit til noe datalagringssystem. Det bør da utføres regelmessige sikkerhetskopier, den sikreste måten å beskytte en database mot skade, er å lagre en sikkerhetskopi på et inert medium på et eksternt sikkert sted, regelmessig oppdatert og kontrollert for gyldigheten og brukbarheten til filene.
Den gradvise økningen i lagringsmedienes kapasitet er en faktor som eksponensielt øker skjørheten til RAID-systemer, som en studie av RAID 5 og 6 har vist.
En nyhet i veien for å nærme seg diskblokkeringsredundans har dukket opp ved California Institute of Technology , som innebærer replikering av blokker ikke innenfor en enkelt server, men mellom flere servere over hele nettverket, som er tydelig for en distribuert RAID. Denne teknikken kalles RAIN (in) for "Redundant Array of Independent Nodes" (eller "Reliable Array of Inexpensive Nodes"), som kan oversettes som "redundant utvalg av uavhengige noder." De viktigste fordelene med denne lagringsarkitekturen er ytelsesnivået og kapasiteten for utvikling.