RAID (informatique)

Le RAID est un ensemble de techniques de virtualisation du stockage permettant de répartir des données sur plusieurs disques durs afin d'améliorer soit les performances, soit la sécurité ou la tolérance aux pannes de l'ensemble du ou des systèmes.

Si ce bandeau n'est plus pertinent, retirez-le. Cliquez ici pour en savoir plus.

Cet article ne cite pas suffisamment ses sources (août 2020).

Si vous disposez d'ouvrages ou d'articles de référence ou si vous connaissez des sites web de qualité traitant du thème abordé ici, merci de compléter l'article en donnant les références utiles à sa vérifiabilité et en les liant à la section « Notes et références ».

En pratique : Quelles sources sont attendues ? Comment ajouter mes sources ?

L'acronyme RAID a été défini en 1987 par l'Université de Berkeley (Californie), dans un article nommé A Case for Redundant Arrays of Inexpensive Disks (RAID)^[1], soit « regroupement redondant de disques peu onéreux ». Aujourd'hui, le mot est devenu l'acronyme de Redundant Array of Independent Disks, ce qui signifie « regroupement redondant de disques indépendants ». Le coût au mégaoctet des disques durs ayant été divisé par 1 300 000 en 29 ans, depuis le RAID est choisi pour d'autres raisons que le coût de l'espace de stockage^[2].

En 1978, un employé d'IBM, Norman Ken Ouchi, déposa un brevet^[3] concernant un « Système de récupération de données stockées dans une unité de stockage défectueuse », et dont la description était ce que deviendrait plus tard le RAID 5. Ce brevet fait également mention du mirroring (en) de disque (qui sera appelé plus tard RAID 1), ainsi que de la protection avec une parité dédiée (correspondant à ce qui sera appelé plus tard RAID 3 ou RAID 4).

La technologie RAID a été élaborée par un groupe de chercheurs de l'université de Californie à Berkeley en 1987. Ces derniers étudièrent la possibilité de faire reconnaître deux disques durs ou plus comme une seule entité par le système. Ils obtinrent pour résultat un système de stockage aux performances bien meilleures que celles des systèmes à disque dur unique, mais doté d'une très mauvaise fiabilité. Les chercheurs s'orientèrent alors vers des architectures redondantes, afin d'améliorer la tolérance aux pannes du système de stockage.

En 1988, les différents RAID, de type 1 à 5, furent formellement définis par David Patterson, Garth Gibson et Randy Katz dans la publication intitulée « A Case for Redundant Arrays of Inexpensive Disks (RAID)^[4] ». Cet article introduisit le terme « RAID », dont l'industrie du disque s'est immédiatement emparée, proposant cinq niveaux ou modes différents, chacun d'eux ayant ses avantages et ses inconvénients, en les comparant au modèle « SLED » (Single Large Expensive Disk : voir ci-dessous).

Le système RAID est :

soit un système de redondance qui donne au stockage des données une certaine tolérance aux pannes matérielles (ex : RAID 1).
soit un système de répartition qui améliore ses performances (ex : RAID 0).
soit les deux à la fois, mais avec une moins bonne efficacité (ex : RAID 5).

Le système RAID est donc capable de gérer d'une manière ou d'une autre la répartition et la cohérence de ces données. Ce système de contrôle peut être purement logiciel ou utiliser un matériel dédié.

Le RAID logiciel

En RAID logiciel, le contrôle du RAID est intégralement assuré par une couche logicielle du système d'exploitation. Cette couche s'intercale entre la couche d'abstraction matérielle (pilote) et la couche du système de fichiers.

Diverses implémentations

La plupart des systèmes d'exploitation grand public permettent déjà de mettre en œuvre le RAID logiciel, qu'il s'agisse de Microsoft Windows, des diverses distributions Linux, ou de Mac OS X.

Microsoft Windows XP (et supérieur) gère les RAID 0 et 1 logiciel, et peut gérer le RAID 5 moyennant une petite adaptation^[5].
Microsoft Windows 2003 Server gère logiciellement les RAID 0, 1, et 5.
Mac OS X gère logiciellement les RAID 0, 1, et la concaténation.
Le noyau Linux (>=2.6) gère logiciellement les RAID 0, 1, 4, 5, 6, et 10, ainsi que les combinaisons de ces modes.
Unraid est un OS basé sur Linux, orienté stockage en réseau et permettant de transformer un PC en NAS avec des disques en RAID.

Les RAID logiciels de Microsoft Windows et de Linux sont incompatibles entre eux^[6] ^{[réf. nécessaire]}.

Le RAID pseudo-matériel

L'immense majorité des contrôleurs RAID bon marché intégrés à de nombreuses cartes-mères depuis 2004/2005 gèrent le RAID 0 et 1 sur des disques durs IDE ou SATA. Malgré le discours marketing à cette époque qui tendait systématiquement à induire en erreur sur ce point, il ne s'agit pas de RAID matériel à proprement parler, mais plutôt d'un contrôleur de disque doté de quelques fonctions avancées. D'un point de vue strictement matériel, cette solution hybride n'est pas différente d'un RAID logiciel. Elle diffère cependant sur l'emplacement des routines logicielles de gestion du RAID.

Avec les matériels plus récents, la différence entre RAID pseudo-matériel et RAID matériel est purement théorique. La seule différence pratique est que dans le RAID pseudo-matériel, processeur et mémoire ne sont pas dédiés. Cependant, la puissance des processeurs récents et le coût réduit de la mémoire font que cette limitation n'est plus un élément critique. Le seul avantage restant pour les RAID spécialisés est la disposition d'outils de gestion des incidents plus performants.

Le RAID matériel

Dans le cas du RAID matériel, une carte ou un composant est affecté à la gestion des opérations. Le contrôleur RAID peut être interne à l'unité centrale (carte d'extension) ou déporté dans une baie de stockage.

Un contrôleur raid est en général doté d'un processeur spécifique, de mémoire dédiée, éventuellement d'une batterie de secours, et est capable de gérer tous les aspects du système de stockage RAID grâce au microcode embarqué (firmware).

Du point de vue du système d'exploitation, le contrôleur RAID matériel offre une virtualisation complète du système de stockage. Le système d'exploitation considère chaque volume RAID comme un volume de stockage unique et n'a pas connaissance de ses constituants physiques.

Les niveaux standards

Les différents types d'architecture RAID sont numérotés à partir de 0 et peuvent se combiner entre eux (on parlera alors de RAID 0+1, 1+0, etc.).

RAID 0 : volume agrégé par bandes

Le RAID 0, également connu sous le nom d'« entrelacement de disques » ou de « volume agrégé par bandes » (striping en anglais), est une configuration RAID permettant d'augmenter significativement les performances de la grappe en faisant travailler $n$ disques durs en parallèle (avec $n\geq 2$ ).

Capacité: La capacité totale est égale à celle du plus petit élément de la grappe multiplié par le nombre d'éléments présents dans la grappe, car le système d'agrégation par bandes se retrouvera bloqué une fois que le plus petit disque sera rempli (voir schéma). L'espace excédentaire des autres éléments de la grappe restera inutilisé. Il est donc conseillé d'utiliser des disques de même capacité.
Fiabilité: Le défaut de cette solution est que la perte d'une seule unité de stockage entraîne la perte de toutes les données du volume RAID.
Coût: Dans un RAID 0, qui n'apporte aucune redondance, tout l'espace disque disponible est utilisé (à condition que les supports soient de même capacité).

Dans cette configuration, les données sont réparties par bandes (stripes en anglais) d'une taille fixe. Cette taille est appelée granularité (voir plus loin la section Granularité).

Exemple

Avec un RAID 0 ayant une taille de bande de 64 kio et composé de deux disques (disque Disk 0 et disque Disk 1), si l'on veut écrire un fichier A de 500 kio, le fichier sera découpé en 8 bandes (car

7<{\frac {500}{64}}\leq 8

). Appelons-les 1, 2, 3, 4, 5, 6, 7 et 8. Elles seront réparties sur l'ensemble des disques de la façon suivante :

Disk 0 : 1, 3, 5, 7

Disk 1 : 2, 4, 6, 8

Ainsi, l'écriture du fichier pourra être effectuée simultanément sur chacun des disques en un temps équivalent à l'écriture de 256 kio, ce qui revient à doubler le débit en écriture.

Ainsi, sur un RAID 0 de $n$ disques (avec $n\geq 2$ ), chaque disque ne doit lire et écrire que ${\frac {1}{n}}$ des données, ce qui a pour effet de diminuer les temps d'accès (lecture et écriture) aux données. Les disques se partageant le travail, les traitements se trouvent accélérés.

Utilisations

Ce type de RAID était parfait pour des applications requérant un traitement rapide d'une grande quantité de données avec des disques durs. Mais cette architecture n'assure en rien la sécurité des données. En effet, si l'un des disques tombe en panne, la totalité des données du volume RAID est perdue.

Le RAID 0 était utilisé dans les ordinateurs, dans le cadre d'applications nécessitant de gros transferts de données (montage vidéo...), plutôt que dans des NAS.

Il peut être utilisé afin d'augmenter la bande passante d'un serveur nécessitant des supports de stockage capables de supporter de très grandes quantités d'écritures.

Nota^[7] : en RAID matériel, la migration d'un RAID 0 avec plusieurs disques vers un RAID 1 est rarement possible, alors que l'inverse l'est. Il est donc plus souple de démarrer en RAID 1.

RAID 1 : Disques en miroir

Le RAID 1 consiste en l'utilisation de $n$ disques redondants (avec $n\geq 2$ ), chaque disque de la grappe contenant à tout moment exactement les mêmes données, d'où l'utilisation du mot « miroir » (mirroring en anglais).

Capacité: La capacité totale est égale à celle du plus petit élément de la grappe, l'espace excédentaire des autres éléments de la grappe restant inutilisé. Il est donc conseillé d'utiliser des éléments de capacité identique.
Fiabilité: Cette solution offre un excellent niveau de protection des données. Elle fonctionne tant qu'il reste au moins un disque fonctionnel.
Coût: Les coûts de stockage sont élevés et directement proportionnels au nombre de miroirs utilisés, alors que la capacité utile reste inchangée. Plus le nombre de miroirs est élevé, et plus la sécurité augmente, mais plus son coût devient rédhibitoire.

Les accès en lecture du système d'exploitation se font sur le disque le plus facilement accessible à ce moment-là^[8]. Les écritures sur la grappe se font de manière simultanée sur tous les disques pour que n'importe quel disque soit interchangeable à tout moment.

Lors de la défaillance de l'un des disques, le contrôleur RAID désactive (de manière transparente pour l'accès aux données) le disque incriminé. Une fois le disque défectueux remplacé, le contrôleur RAID reconstitue, soit automatiquement, soit sur intervention manuelle, le miroir. Une fois la synchronisation effectuée, le RAID retrouve son niveau initial de redondance.

Nota^[7] : la migration du RAID 1 vers RAID 0, RAID 5, RAID 6 est presque toujours envisageable, ce qui fait du RAID 1 une bonne solution de départ si on n'a pas un besoin important en performance .

RAID 5 : volume agrégé par bandes à parité répartie

Le RAID 5 combine la méthode du volume agrégé par bandes (striping) à une parité répartie. Il s'agit là d'un ensemble à redondance $N+1$ . La parité, qui est incluse avec chaque écriture, se retrouve répartie circulairement sur les différents disques. Chaque bande est donc constituée de $N$ blocs de données et d'un bloc de parité. Ainsi, en cas de défaillance de l'un des disques de la grappe, pour chaque bande il manquera soit un bloc de données soit le bloc de parité. Si c'est le bloc de parité, ce n'est pas grave, car aucune donnée ne manque. Si c'est un bloc de données, on peut calculer son contenu à partir des $N-1$ autres blocs de données et du bloc de parité. L'intégrité des données de chaque bande est préservée. Donc non seulement la grappe est toujours en état de fonctionner, mais il est de plus possible de reconstruire le disque une fois échangé à partir des données et des informations de parité contenues sur les autres disques.

On voit donc que le RAID 5 ne supporte la perte que d'un seul disque à la fois, ce qui devient un problème depuis que les disques qui composent une grappe sont de plus en plus gros (1 To et plus), car le temps de reconstruction de la parité en cas de disque défaillant est allongé (ce qui augmente la probabilité de survenue d'une nouvelle défaillance car les autres disques durs sont sollicités de façon intensive durant la reconstruction). Ainsi, le temps de reconstruction est long, et plus les disques sont volumineux, plus la durée de reconstruction est longue. Pour limiter le risque, il est courant d'ajouter un disque de rechange (spare), dédié au remplacement immédiat d'un éventuel disque défaillant : en régime normal celui-ci est inutilisé ; en cas de panne d'un disque, il prendra automatiquement la place du disque défaillant. Cela nécessite une phase communément appelée recalcul de parité, consistant à recréer sur le nouveau disque le bloc manquant (données ou parité) pour chaque bande. Pendant le processus de recalcul de parité, le volume RAID reste disponible normalement, le système se trouve juste un peu ralenti.

Exemple pratique : Considérons quatre disques durs A, B, C et D, de taille identique. Le système va répartir les premiers blocs sur les disques A, B et C comme en mode RAID 0 (striping) et, sur le disque D, le résultat de l'opération OU exclusif entre les autres disques (ici A xor B xor C). Il va répartir les blocs suivants sur les disques D, A et B, puis la parité (soit D xor A xor B) sur le disque C, et ainsi de suite en permutant circulairement les disques, à chaque bloc. La parité se trouve alors répartie sur l'ensemble des disques.

En cas de défaillance d'un disque, les données qui s'y trouvaient pourront être reconstituées par l'opération xor. En effet, l'opération XOR (

\oplus

) a la propriété suivante : si on considère

N

blocs de taille identique

\scriptstyle A_{1},A_{2}\cdots A_{N}

et si

\scriptstyle A_{1}\oplus A_{2}\oplus \cdots A_{N}=X

alors

\scriptstyle X\oplus A_{2}\oplus \cdots A_{N}=A_{1}

, et de façon générale,

\scriptstyle A_{1}\oplus \cdots A_{k-1}\oplus X\oplus A_{k+1}\oplus \cdots A_{N}=A_{k}

.

C'est-à-dire que n'importe quel bloc de données

A_{k}

perdu à cause d'un disque défaillant sur un RAID 5 de

N+1

disques peut être récupéré grâce au bloc

X

de données de contrôle.

On voit donc que si on veut écrire dans un bloc, il faut :

lire le bloc à modifier ;
lire le bloc de parité de la bande ;
écrire le bloc de données et le bloc de parité.

L'opération xor permet heureusement de calculer la nouvelle parité sans avoir besoin de lire les

N

blocs de données de la bande. Augmenter le nombre de disques d'une grappe RAID 5 n'allonge donc pas le temps de lecture ou d'écriture. Cependant si plusieurs processus veulent écrire simultanément dans un ou plusieurs blocs de données d'une même bande la mise à jour du bloc de parité devient un point de blocage. Les processus concurrents sont suspendus à la libération du bloc de parité et de fait cela limite le débit d'écriture. Plus le nombre de disques d'une grappe RAID 5 augmente plus le temps de reconstruction d'un disque défaillant augmente, puisque pour reconstituer le bloc manquant d'une bande il faut lire tous les autres blocs de la bande et donc tous les autres disques.

Ce système nécessite impérativement un minimum de trois disques durs. Ceux-ci doivent généralement être de même taille, mais un grand nombre de cartes RAID modernes autorisent des disques de tailles différentes, bien que cela ne soit pas optimal. La capacité de stockage utile réelle, pour un système de $X$ disques de capacité $c$ identiques est de $(X-1)\times c$ . En cas d'utilisation de disques de capacités différentes, le système utilisera dans la formule précédente la capacité minimale. Ainsi par exemple, trois disques de 100 Go en RAID 5 offrent 200 Go utiles ; dix disques, 900 Go utiles.

Ce système allie sécurité (grâce à la parité) et bonne disponibilité (grâce à la répartition de la parité), même en cas de défaillance d'un des périphériques de stockage.

Il existe une variante : le « RAID 5 varientable » où chaque disque a son propre contrôle. Toutes les autres fonctionnalités sont identiques.

On a souvent tendance à croire qu'un système RAID 5 est totalement fiable. Il est en effet généralement admis que la probabilité de défaillance simultanée de plusieurs disques est extrêmement faible — on parle évidemment d'une défaillance entraînant la perte d'accès complète et définitive aux données de plusieurs disques et non d'une simple indisponibilité de plusieurs disques. Cela est vrai pour une défaillance générale d'une unité de disque. Cependant, cela est faux si l'on considère comme défaillance un seul secteur devenu illisible.

En effet, dans la pratique, il est très rare que toutes les données d'un volume soient lues régulièrement. Et quand bien même ce serait le cas, la cohérence de la parité n'est que très rarement vérifiée pour des raisons de performances. Il est donc probable que des défauts tels que des secteurs de parité illisibles ne soient pas détectés pendant une très longue période. Lorsque l'un des disques devient réellement défectueux, la reconstruction nécessite de parcourir l'intégralité des disques restants. On peut alors découvrir des défauts qui étaient restés invisibles jusque-là.

Tout ceci pourrait ne pas être bien grave et occasionner la perte d'une quantité de données minime (un secteur de disque dans cet exemple soit généralement 512 octets), cependant, l'immense majorité des contrôleurs RAID sont incapables de gérer les défaillances partielles et considèrent généralement comme « défaillant » un disque contenant un seul secteur illisible. Donc, si un disque dur tombe en panne, tandis qu'un secteur illisible est rencontré au moment de la reconstruction, deux disques sont considérés défaillants simultanément et le volume RAID 5 devient inutilisable. Il devient alors difficile et coûteux de récupérer les données non sauvegardées.

Un système RAID 5 doit donc être vérifié et sauvegardé périodiquement pour s'assurer que l'on ne risque pas de tomber sur ce genre de cas.

Avantages :

Performances en lecture aussi élevées qu'en RAID 0,

Tolère la perte d'un disque.

Inconvénients :

Ralentissement en écriture du fait du calcul de la parité,

Capacité utile de

n-1

disques sur un total de n disques.

Temps de reconstruction long pour les disques durs de grande capacité.

Les niveaux de RAID peu courants

Concaténation de disques

NRAID / Non-RAID : Near/Non Redundant Array of Inexpensive/Independent Disk

La concaténation de disques consiste à additionner les capacités de plusieurs disques durs en un volume logique d'une taille équivalente à la somme des tailles des disques durs. Cette méthode utilise une méthode d'écriture séquentielle : les données ne sont écrites sur le disque dur suivant que lorsqu'il ne reste plus de place sur le précédent.^{[Information douteuse]}

Le NRAID n'est pas à proprement parler un RAID, et il ne permet d'ailleurs aucune redondance de données. La panne d'un disque peut avoir des conséquences désastreuses sur le reste des données si des métadonnées critiques sont affectées.
Il est parfois confondu à tort avec le JBOD, qui désigne une baie de stockage regroupant des unités accessibles individuellement, sans configuration spéciale.

Le NRAID est aussi désigné comme « Volume Simple » sous Windows (à partir de Windows 2000)^[9].

RAID 2 : volume agrégé par bandes à parité

Le RAID 2 est aujourd'hui désuet. Il combine la méthode du RAID 0 (volume agrégé par bande) à l'écriture d'un code de contrôle d'erreur par code de Hamming (code ECC) sur un disque dur distinct. Or, l'écriture de ce code de contrôle est désormais directement intégrée dans les contrôleurs de disques durs. Cette technologie offre un bon niveau de sécurité, mais de mauvaises performances.

RAID 3 et RAID 4

Le RAID 3 et le RAID 4 sont semblables à ceci près que le premier opère par octets et le second par blocs. Le RAID 4 ne nécessite pas autant de synchronisme entre les disques. Le RAID 3 tend donc à disparaître au profit du RAID 4 qui offre des performances nettement supérieures.

Ces niveaux de RAID nécessitent une matrice de $n$ disques (avec $n\geq 3$ ). Les $n-1$ premiers disques contiennent les données tandis que le dernier disque stocke la parité (voir section parité).

Si le disque de parité tombe en panne, il est possible de reconstruire l'information de parité avec le contenu des autres disques de données.
Si l'un des disques de données tombe en panne, il est possible de reconstruire l'information avec le contenu des disques de données restants et celui du disque de parité.

Il est important que le disque de parité soit de bonne qualité, car il est à tout instant sollicité en écriture. Ce dernier point est une des limitations des RAID 3 et 4.

De même, si plus d'un disque vient à défaillir, il est impossible de remédier à la perte de données.

RAID 6

Le RAID 6 est une évolution du RAID 5 qui accroît la sécurité en utilisant $n$ informations redondantes au lieu d'une. Il peut donc résister à la défaillance de $n$ disques. Les fondements mathématiques utilisés pour les informations de redondance du RAID 6 sont beaucoup plus complexes que pour le RAID 5 ; de ce fait les implémentations de l'algorithme se limitent souvent à $n=2$ (soit la perte de 2 disques).

Si la sécurité est plus grande, le coût en matériel est plus élevé et la vitesse est moindre. La puissance CPU nécessaire pour calculer les redondances et surtout pour reconstruire un volume défectueux est également nettement plus importante.

Les défauts majeurs sont :

Les temps d'écriture sont allongés à cause des calculs de redondance complexes.
Le temps de reconstruction en cas de défaillance simultanée de 2 disques est nettement allongé.

Le RAID 6 était peu utilisé du fait de son surcoût. Toutefois l'envolée des capacités des disques durs ces dernières années ainsi que la vulgarisation de solutions professionnelles à base de disques SATA a suscité un intérêt nouveau dans l'utilisation du RAID 6, que ce soit par le biais de contrôleurs RAID matériels ou via du RAID logiciel (le noyau Linux 2.6 intègre le RAID 6).

La capacité utile totale ( $C_{Ut}$ ), pour un système avec $k$ disques dont $n$ réservés pour la redondance est de $C_{Ut}=(k-n)\times c$ ( $c$ = capacité du plus petit des disques dur).

Des explications intéressantes, mais un peu ardues sont disponibles dans la version anglaise de cet article^[10] ainsi que dans Les mathématiques du RAID 6^[11].

RAID S

Cette section est vide, insuffisamment détaillée ou incomplète. Votre aide est la bienvenue ! Comment faire ?

Est aussi connu sous le nom de Parity RAID. Cette méthode de remplacement propriétaire des solutions EMC Symmetrix permet de mettre en œuvre une batterie RAID à parité agrégée en bandes. Elle n'est plus utilisée sur des équipements actuels. Si le RAID S semble similaire au RAID 5, il présente certaines performances améliorées, notamment celles que procure la présence d'un cache de disque à haut débit sur la batterie^[12].

Sun RAID-Z

Ce système résout également les problèmes de corruption silencieuse du RAID 5 grâce aux opérations de scrub qui analysent toutes les données de la grappe afin de détecter des incohérences.

Le système RAID-Z est moins performant que le RAID 5 : chaque accès en lecture ou en écriture accédant à tous les disques, il ne permet pas de profiter de la multiplication des têtes de lectures. Il permet en revanche l'utilisation de la mémoire RAM comme cache (ARC). Il est aussi possible de dédier des SSD au rôle de cache en lecture (L2ARC) ou cache en écriture (ZIL) pour améliorer les performances d'une grappe^[13]^,^[14].

Synology Hybrid Raid (SHR)

Technologie propriétaire de Synology relative au système RAID, simulant le fonctionnement d'un RAID 5 en acceptant des disques de tailles différentes tout en minimisant les espaces inutilisés^[15].

Synology Hybrid Raid 2 (SHR-2)

Technologie propriétaire de Synology relative au système RAID, simulant le fonctionnement d'un RAID 6 en acceptant des disques de tailles différentes tout en minimisant les espaces inutilisés^[16].

X-RAID (NetGear)

Le système X-RAID est une technique développée par Netgear sur sa suite de produits ReadyNAS. Cette technologie permet suivant le nombre de disques de choisir entre les différents types de RAID et de passer de l'un à l'autre sans perte de données ou arrêt de service. X-RAID utilise principalement les RAID 1 et 5.

Le RAID ne dispense pas d'effectuer des sauvegardes régulières. En effet, des défaillances à plusieurs disques sont plus fréquentes que l'on ne le croit (voir section RAID 5 plus haut). De plus, des erreurs humaines (effacement / corruption de fichiers) finissent toujours par se produire. Un exemple classique de défaillance simultanée de plusieurs disques est le suivant : un premier disque est victime d'un atterrissage de tête, provoquant la dislocation d'une partie de la surface des plateaux ; mais le disque continuant de tourner se met à chauffer et atteint une température gênante pour ses voisins… On comprendra que l'un des disques se trouvant à côté peut à son tour connaître une défaillance du fait de la température locale excessive.

De plus, la taille des disques ne cessant de croître, un RAID dépassant les 12 To utiles (RAID 5 à quatre disques de 4 To par exemple) sera probablement impossible à reconstruire, car atteignant la limite de fiabilité des contrôleurs SATA (sauf pour des contrôleurs haut de gamme pour serveur) : il sera presque sûr statistiquement qu'une erreur de lecture / écriture se produira pendant la reconstruction^[17]. Cela serait aussi valable pour les RAID-Z^[18].

Comment le RAID peut poser problème

L'augmentation progressive de la capacité des supports de stockage est un facteur qui augmente exponentiellement la fragilité des systèmes RAID, comme l'a montré une étude sur les RAID 5 et 6 ^[19].

Une nouveauté dans la façon d'aborder la redondance des blocs disques est apparue au California Institute of Technology, consistant à répliquer les blocs non pas à l'intérieur d'un seul serveur, mais entre plusieurs serveurs à travers le réseau^[20], ce qui s'apparente à un RAID réparti. Cette technique est appelée RAIN (en), pour « Redundant Array of Independent Nodes »^[21] (ou « Reliable Array of Inexpensive Nodes »)^[22], que l'on peut traduire par « réseau redondant de nœuds indépendants »^[23]. Les principaux intérêts de cette architecture de stockage sont son niveau de performance et sa capacité d'évolution^[24].

[1]
(en) Jakob Østergaard, Emilio Bueso et al., The Software-RAID HOWTO, 6 mars 2010, 1.1.1 éd., 46 p. (lire en ligne).
[2]
(en) Définition de RAID sur le site de Seagate
[3]
(en) Brevet U.S. 4,092,732 déposé par Norman Ken Ouchi
[4]
(en) [PDF] L'article ayant donné naissance à la technologie RAID
[5]
Patrick Schmid, Achim Roos, « Monter un système RAID 5 avec Windows XP », sur Ère numérique, 4 janvier 2005.
[6]
Linux offre néanmoins la possibilité, avec certaines restrictions, d'accéder aux volumes RAID créés sous Windows, grâce au paquet dmraid. Voir le lien « Utiliser du RAID semi-matériel »
[7]
« Support », sur dell.com (consulté le 12 avril 2023).
[8]
Eric Thirion, « Les bases de la programmation », Developpez.com (consulté le 3 juillet 2024).
[9]
« Créer un volume simple », sur technet.microsoft.com.
[10]
(en) Standard RAID levels
[11]
(en) [PDF] Les mathématiques du RAID 6, par Peter Anvin
[12]
« Que signifie RAID (Redundant Array of Independent Disks)? - Definition IT de Whatis.fr », sur LeMagIT (consulté le 23 août 2019).
[13]
« Explanation of ARC and L2ARC » ZFS Build », sur zfsbuild.com (consulté le 10 octobre 2015).
[14]
(en) « The Blog of Ben Rockwood ».
[15]
« Qu'est-ce que Synology Hybrid RAID (SHR)? », sur synology.com (consulté le 12 avril 2023).
[16]
« Test SHR & SHR-2 » .
[17]
(en) « Why RAID 5 stops working in 2009 », sur zdnet.
[18]
(en) « Freenas hardware recommendations ».
[19]
(en) « Triple-Parity RAID and Beyond », sur acm.org.
[20]
(en) http://www.paradise.caltech.edu/papers/etr029.pdf [PDF]
[21]
« What is Redundant Array of Independent Nodes (RAIN)? - Definition from Techopedia », sur Techopedia.com (consulté le 16 août 2020).
[22]
(en) Margaret Rouse, « RAIN (redundant/reliable array of inexpensive/independent nodes) », sur techtarget.com, 10 mars 2006 (consulté le 16 août 2020).
[23]
« Dell étoffe son offre stockage avec une solution objets, le DX6000 - Le Monde Informatique », sur Le Monde informatique (consulté le 16 août 2020).
[24]
(en) « RAIN architecture scales storage », sur networkworld.com via Internet Archive (consulté le 16 octobre 2023).

Article connexe

mdadm

Liens externes

Sur les autres projets Wikimedia :

RAID, sur le Wiktionnaire
RAID (informatique), sur Wikibooks

[1] [1]
(en) Jakob Østergaard, Emilio Bueso et al., The Software-RAID HOWTO, 6 mars 2010, 1.1.1 éd., 46 p. (lire en ligne).

[2] [2]
(en) Définition de RAID sur le site de Seagate

[3] [3]
(en) Brevet U.S. 4,092,732 déposé par Norman Ken Ouchi

[4] [4]
(en) [PDF] L'article ayant donné naissance à la technologie RAID

[5] [5]
Patrick Schmid, Achim Roos, « Monter un système RAID 5 avec Windows XP », sur Ère numérique, 4 janvier 2005.

[6] [6]
Linux offre néanmoins la possibilité, avec certaines restrictions, d'accéder aux volumes RAID créés sous Windows, grâce au paquet dmraid. Voir le lien « Utiliser du RAID semi-matériel »

[RAID_dans_le_support_DELL_PowerEdge-7] [7]
« Support », sur dell.com (consulté le 12 avril 2023).

[8] [8]
Eric Thirion, « Les bases de la programmation », Developpez.com (consulté le 3 juillet 2024).

[9] [9]
« Créer un volume simple », sur technet.microsoft.com.

[10] [10]
(en) Standard RAID levels

[11] [11]
(en) [PDF] Les mathématiques du RAID 6, par Peter Anvin

[12] [12]
« Que signifie RAID (Redundant Array of Independent Disks)? - Definition IT de Whatis.fr », sur LeMagIT (consulté le 23 août 2019).

[13] [13]
« Explanation of ARC and L2ARC » ZFS Build », sur zfsbuild.com (consulté le 10 octobre 2015).

[14] [14]
(en) « The Blog of Ben Rockwood ».

[15] [15]
« Qu'est-ce que Synology Hybrid RAID (SHR)? », sur synology.com (consulté le 12 avril 2023).

[16] [16]
« Test SHR & SHR-2 » .

[17] [17]
(en) « Why RAID 5 stops working in 2009 », sur zdnet.

[18] [18]
(en) « Freenas hardware recommendations ».

[19] [19]
(en) « Triple-Parity RAID and Beyond », sur acm.org.

[20] [20]
(en) http://www.paradise.caltech.edu/papers/etr029.pdf [PDF]

[21] [21]
« What is Redundant Array of Independent Nodes (RAIN)? - Definition from Techopedia », sur Techopedia.com (consulté le 16 août 2020).

[22] [22]
(en) Margaret Rouse, « RAIN (redundant/reliable array of inexpensive/independent nodes) », sur techtarget.com, 10 mars 2006 (consulté le 16 août 2020).

[23] [23]
« Dell étoffe son offre stockage avec une solution objets, le DX6000 - Le Monde Informatique », sur Le Monde informatique (consulté le 16 août 2020).

[24] [24]
(en) « RAIN architecture scales storage », sur networkworld.com via Internet Archive (consulté le 16 octobre 2023).

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]