Introduksjon til RAID, konsepter for RAID og RAID-nivåer - Del 1


RAID er et redundant utvalg av rimelige disker, men i dag kalles det Redundant Array of Independent-stasjoner. Tidligere pleide det å være svært kostbart å kjøpe selv en mindre størrelse disk, men i dag kan vi kjøpe en stor størrelse disk med samme mengde som før. Raid er bare en samling av disker i et basseng for å bli et logisk volum.

Raid inneholder grupper eller sett eller matriser. En kombinasjon av drivere lager en gruppe disker for å danne et RAID-array eller RAID-sett. Det kan være et minimum på 2 antall disker koblet til en raid-kontroller og lage et logisk volum eller flere stasjoner kan være i en gruppe. Bare ett Raid-nivå kan brukes i en gruppe disker. Raid brukes når vi trenger utmerket ytelse. I henhold til vårt valgte raidnivå vil ytelsen variere. Lagring av dataene våre etter feiltoleranse og høy tilgjengelighet.

Denne serien vil ha tittelen Forberedelse for oppsett av RAID-er gjennom del 1-9 og dekker følgende emner.

Dette er del 1 av en 9-veiledningsserie, her vil vi dekke introduksjonen av RAID, konsepter for RAID og RAID-nivåer som kreves for å sette opp RAID i Linux.

Software RAID og Hardware RAID

Programvare RAID har lav ytelse på grunn av forbruk av ressurser fra verter. Raid-programvare må lastes inn for å lese data fra programvareraid-volumer. Før du laster raid-programvare, må operativsystemet starte opp for å laste raid-programvaren. Ikke behov for fysisk maskinvare i programvareraid. Nullkostnadsinvestering.

Maskinvare RAID har høy ytelse. De er en dedikert RAID-kontroller som er fysisk bygget med PCI-ekspresskort. Den vil ikke bruke vertsressursen. De har NVRAM for cache for å lese og skrive. Lagrer hurtigbufferen mens den gjenoppbygges, selv om det er strømbrudd, vil den lagre hurtigbufferen ved hjelp av sikkerhetskopiering av batteristrøm. Svært kostbare investeringer som trengs for en stor skala.

Maskinvare RAID-kort vil se slik ut:

  1. Paritet-metoden i raid regenerer tapt innhold fra paritetslagret informasjon. RAID 5, RAID 6 Basert på paritet.
  2. Stripe deler data tilfeldig til flere disker. Dette vil ikke ha fulle data på en enkelt disk. Hvis vi bruker 3 disker, vil halvparten av dataene våre være på hver disk.
  3. Speiling brukes i RAID 1 og RAID 10. Speiling er å lage en kopi av samme data. I RAID 1 vil den lagre det samme innholdet på den andre disken også.
  4. Hot spare er bare en reservestasjon på serveren vår som automatisk kan erstatte de mislykkede stasjonene. Hvis noen av stasjonene mislyktes i arrayet vårt, vil denne varme reservedisken bli brukt og gjenoppbygget automatisk.
  5. Kunker er bare en datastørrelse som kan være minimum fra 4 KB og mer. Ved å definere chunk-størrelse kan vi øke I/O-ytelsen.

RAID-er er på forskjellige nivåer. Her vil vi bare se RAID-nivåene som brukes mest i virkelige omgivelser.

  1. RAID0 = Striping
  2. RAID1 = Speiling
  3. RAID5 = Single Disk Distributed Parity
  4. RAID6 = Dobbel diskdistribuert paritet
  5. RAID10 = Kombinasjon av speil og stripe. (Nestet RAID)

RAID administreres ved hjelp av mdadm-pakken i de fleste Linux-distribusjoner. La oss få en kort titt på hvert RAID-nivå.

Striping har en utmerket ytelse. I Raid 0 (Striping) vil dataene bli skrevet til disk ved hjelp av delt metode. Halvparten av innholdet vil være på en disk og en annen halvpart vil bli skrevet til en annen disk.

La oss anta at vi har 2 diskstasjoner, for eksempel, hvis vi skriver data TECMINT til logisk volum, vil det bli lagret som T vil bli lagret på den første disken og 'E' vil bli lagret på den andre disken og 'C' vil bli lagret på den første disken og igjen vil 'M' bli lagret i Andre disk og den fortsetter i round-robin prosess.

I denne situasjonen hvis noen av stasjonene svikter, vil vi miste dataene våre, fordi med halvparten av dataene fra en av diskene kan de ikke bruke til å gjenoppbygge raidet. Men mens man sammenligner med skrivehastighet og ytelse, er RAID 0 utmerket. Vi trenger minst 2 disker for å lage en RAID 0 (Striping). Hvis du trenger dine verdifulle data, ikke bruk dette RAID-NIVÅET.

  1. Høy ytelse.
  2. Det er null kapasitetstap i RAID 0
  3. Null feiltoleranse.
  4. Skriv og lesing vil være god ytelse.

Speiling har en god ytelse. Speiling kan lage en kopi av samme data som vi har. Forutsatt at vi har to antall 2TB harddisker, totalt der har vi 4TB, men i speiling mens stasjonene er bak RAID-kontrolleren for å danne en logisk stasjon Bare vi kan se 2TB med logisk stasjon.

Mens vi lagrer data, vil den skrive til begge 2TB-stasjonene. Minimum to stasjoner er nødvendig for å lage en RAID 1 eller Mirror. Hvis det oppstod en diskfeil, kan vi reprodusere raidsettet ved å erstatte en ny disk. Hvis noen av diskene svikter i RAID 1, kan vi hente dataene fra den andre siden det var en kopi av det samme innholdet på den andre disken. Så det er null datatap.

  1. God ytelse.
  2. Her vil halvparten av plassen gå tapt i total kapasitet.
  3. Full feiltoleranse.
  4. Gjenoppbygging vil gå raskere.
  5. Skriveytelsen vil være treg.
  6. Det blir bra å lese.
  7. Kan brukes for operativsystemer og databaser for liten skala.

RAID 5 brukes mest på bedriftsnivå. RAID 5 fungerer etter distribuert paritetsmetode. Paritetsinformasjon vil bli brukt til å gjenoppbygge dataene. Den gjenoppbygges fra informasjonen som er igjen på de gjenværende gode stasjonene. Dette vil beskytte dataene våre mot stasjonsfeil.

Anta at vi har 4 stasjoner, hvis en stasjon svikter og mens vi erstatter den mislykkede stasjonen, kan vi gjenoppbygge den erstattede stasjonen fra paritetsinformasjon. Paritetsinformasjon er lagret i alle 4 stasjonene, hvis vi har 4 tall på 1 TB harddisk. Paritetsinformasjonen vil bli lagret i 256 GB i hver driver, og andre 768 GB i hver stasjon vil bli definert for brukere. RAID 5 kan overleve fra en enkelt stasjonsfeil, hvis stasjoner svikter mer enn 1 vil føre til tap av data.

  1. Utmerket ytelse
  2. Lesing vil være ekstremt god i hastighet.
  3. Skriving vil være gjennomsnittlig, sakte hvis vi ikke bruker en maskinvare-RAID-kontroller.
  4. Gjenoppbygg fra paritetsinformasjon fra alle stasjoner.
  5. Full feiltoleranse.
  6. 1 diskplass vil være under paritet.
  7. Kan brukes i filservere, webservere, svært viktige sikkerhetskopier.

RAID 6 er det samme som RAID 5 med distribuert system med to pariteter. Mest brukt i et stort antall arrays. Vi trenger minimum 4 stasjoner, selv om 2 stasjoner feiler, kan vi gjenoppbygge dataene mens vi erstatter nye stasjoner.

Veldig tregere enn RAID 5, fordi den skriver data til alle 4 driverne samtidig. Vil være gjennomsnittlig i hastighet mens vi bruker en Hardware RAID Controller. Hvis vi har 6 tall på 1 TB harddisker, vil 4 stasjoner bli brukt for data og 2 stasjoner vil bli brukt for paritet.

  1. Dårlig ytelse.
  2. Leseytelsen vil være god.
  3. Skriveytelsen vil være dårlig hvis vi ikke bruker en maskinvare-RAID-kontroller.
  4. Gjenoppbygg fra 2 paritetsstasjoner.
  5. Full feiltoleranse.
  6. 2 diskplass vil være under paritet.
  7. Kan brukes i store matriser.
  8. Kan brukes til sikkerhetskopiering, videostrømming, brukt i stor skala.

RAID 10 kan kalles som 1+0 eller 0+1. Dette vil gjøre begge verkene til Mirror & Striping. Mirror vil være det første og stripe vil være det andre i RAID 10. Stripe vil være det første og speilet blir det andre i RAID 01. RAID 10 er bedre sammenlignet med 01.

Anta at vi har 4 antall stasjoner. Mens jeg skriver noen data til det logiske volumet mitt, vil det bli lagret under Alle 4 stasjonene ved å bruke speil- og stripemetoder.

Hvis jeg skriver en data TECMINT i RAID 10 vil den lagre dataene som følger. Den første T vil skrive til begge diskene og den andre E vil skrive til begge diskene, dette trinnet vil bli brukt for all dataskriving. Det vil også lage en kopi av alle data til en annen disk.

Samtidig vil den bruke RAID 0-metoden og skrive data som følger «T» vil skrive til den første disken og «E» vil skrive til den andre disken. Igjen vil «C» skrive til den første disken og «M» til den andre disken.

  1. God lese- og skriveytelse.
  2. Her vil halvparten av plassen gå tapt i total kapasitet.
  3. Feiltoleranse.
  4. Rask gjenoppbygging fra kopiering av data.
  5. Kan brukes i databaselagring for høy ytelse og tilgjengelighet.

Konklusjon

I denne artikkelen har vi sett hva som er RAID og hvilke nivåer som mest brukes i RAID i virkelige omgivelser. Håper du har lært oppskriften om RAID. For RAID-oppsett må man vite om grunnleggende kunnskap om RAID. Innholdet ovenfor vil oppfylle grunnleggende forståelse om RAID.

I de neste kommende artiklene skal jeg dekke hvordan du setter opp og oppretter en RAID ved hjelp av forskjellige nivåer, å vokse en RAID-gruppe (array) og feilsøking med feilsøkte stasjoner og mye mer.