Sur un systeme RAID 1 ou RAID 5, il est de bon ton de garder un disque
en "hot spare" sur sa baie, pour le cas malheureux où un disque du
groupe RAID viendrait à lâcher.
Mais quid du "hot spare" sur un RAID 6 ??? En RAID6, on a une redondance
n+2, donc si un disque pète, on est toujours "safe" puisqu'il faut au
moins 2 disques morts pour que ça commence à craindre...
Je me demande donc quelles sont la pratiques fréquemment... pratiquées
par les pros quand ils déploient du RAID6 : hot-spare ou pas hot-spare ?
et si hot-spare, pourquoi ? Par habitude, ou bien y a t'il une vraie
raison technique ?
Sur un systeme RAID 1 ou RAID 5, il est de bon ton de garder un disque en "hot spare" sur sa baie, pour le cas malheureux où un disque du groupe RAID viendrait à lâcher.
Mais quid du "hot spare" sur un RAID 6 ??? En RAID6, on a une redondance n+2, donc si un disque pète, on est toujours "safe" puisqu'il faut au moins 2 disques morts pour que ça commence à craindre...
Sans être un spécialiste du stockage, il me semble que le RAID 6 est plutôt utilisé avec un nombre de disques supérieur au RAID 5 et a fortiori au RAID 1. Dans ces conditions, la probabilité que deux disques soient défectueux n'est peut-être plus si négligeable.
Salut,
Eric Belhomme a écrit :
Sur un systeme RAID 1 ou RAID 5, il est de bon ton de garder un disque
en "hot spare" sur sa baie, pour le cas malheureux où un disque du
groupe RAID viendrait à lâcher.
Mais quid du "hot spare" sur un RAID 6 ??? En RAID6, on a une redondance
n+2, donc si un disque pète, on est toujours "safe" puisqu'il faut au
moins 2 disques morts pour que ça commence à craindre...
Sans être un spécialiste du stockage, il me semble que le RAID 6 est
plutôt utilisé avec un nombre de disques supérieur au RAID 5 et a
fortiori au RAID 1. Dans ces conditions, la probabilité que deux disques
soient défectueux n'est peut-être plus si négligeable.
Sur un systeme RAID 1 ou RAID 5, il est de bon ton de garder un disque en "hot spare" sur sa baie, pour le cas malheureux où un disque du groupe RAID viendrait à lâcher.
Mais quid du "hot spare" sur un RAID 6 ??? En RAID6, on a une redondance n+2, donc si un disque pète, on est toujours "safe" puisqu'il faut au moins 2 disques morts pour que ça commence à craindre...
Sans être un spécialiste du stockage, il me semble que le RAID 6 est plutôt utilisé avec un nombre de disques supérieur au RAID 5 et a fortiori au RAID 1. Dans ces conditions, la probabilité que deux disques soient défectueux n'est peut-être plus si négligeable.
Olivier B.
On 09 Apr 2010 15:40:04 GMT, Eric Belhomme wrote:
Bonjour,
Sur un systeme RAID 1 ou RAID 5, il est de bon ton de garder un disque en "hot spare" sur sa baie, pour le cas malheureux où un disque du groupe RAID viendrait à lâcher.
Mais quid du "hot spare" sur un RAID 6 ??? En RAID6, on a une redondance n+2, donc si un disque pète, on est toujours "safe" puisqu'il faut au moins 2 disques morts pour que ça commence à craindre...
Je me demande donc quelles sont la pratiques fréquemment... pratiquées par les pros quand ils déploient du RAID6 : hot-spare ou pas hot-spare ? et si hot-spare, pourquoi ? Par habitude, ou bien y a t'il une vraie raison technique ?
amha l'enorme avantage du hot spare est d'être ... hot ! donc technicien sur place ou en week-end le niveau de redondance otpimal est retrouvé au plus tot.
L'autre avantage c'est qu'un hot spare aura fait sa crise de jeunesse avant d'etre sollicité contrairement à un disque d'étagère.
-- pas de turlututu. apres l'@robase
On 09 Apr 2010 15:40:04 GMT, Eric Belhomme <rico@ricozome.net> wrote:
Bonjour,
Sur un systeme RAID 1 ou RAID 5, il est de bon ton de garder un disque
en "hot spare" sur sa baie, pour le cas malheureux où un disque du
groupe RAID viendrait à lâcher.
Mais quid du "hot spare" sur un RAID 6 ??? En RAID6, on a une redondance
n+2, donc si un disque pète, on est toujours "safe" puisqu'il faut au
moins 2 disques morts pour que ça commence à craindre...
Je me demande donc quelles sont la pratiques fréquemment... pratiquées
par les pros quand ils déploient du RAID6 : hot-spare ou pas hot-spare ?
et si hot-spare, pourquoi ? Par habitude, ou bien y a t'il une vraie
raison technique ?
amha l'enorme avantage du hot spare est d'être ... hot !
donc technicien sur place ou en week-end le niveau de redondance
otpimal est retrouvé au plus tot.
L'autre avantage c'est qu'un hot spare aura fait sa crise de jeunesse
avant d'etre sollicité contrairement à un disque d'étagère.
Sur un systeme RAID 1 ou RAID 5, il est de bon ton de garder un disque en "hot spare" sur sa baie, pour le cas malheureux où un disque du groupe RAID viendrait à lâcher.
Mais quid du "hot spare" sur un RAID 6 ??? En RAID6, on a une redondance n+2, donc si un disque pète, on est toujours "safe" puisqu'il faut au moins 2 disques morts pour que ça commence à craindre...
Je me demande donc quelles sont la pratiques fréquemment... pratiquées par les pros quand ils déploient du RAID6 : hot-spare ou pas hot-spare ? et si hot-spare, pourquoi ? Par habitude, ou bien y a t'il une vraie raison technique ?
amha l'enorme avantage du hot spare est d'être ... hot ! donc technicien sur place ou en week-end le niveau de redondance otpimal est retrouvé au plus tot.
L'autre avantage c'est qu'un hot spare aura fait sa crise de jeunesse avant d'etre sollicité contrairement à un disque d'étagère.
-- pas de turlututu. apres l'@robase
Emmanuel Florac
Le Fri, 09 Apr 2010 15:40:04 +0000, Eric Belhomme a écrit:
e me demande donc quelles sont la pratiques fréquemment... pratiquées par les pros quand ils déploient du RAID6 : hot-spare ou pas hot-spare ? et si hot-spare, pourquoi ? Par habitude, ou bien y a t'il une vraie raison technique ?
En tant que pro, je déploie du RAID-6 avec hot spare. L'idée est de minimiser la durée de protection réduite... Puis on ne peut pas faire confiance à un utilisateur qui est sensé surveiller, combien de bécanes j'ai trouvé avec deux disques grillés dans la même grappe? heureusement il y avait un spare.
-- Writing about music is like dancing about architecture. Frank Zappa
Le Fri, 09 Apr 2010 15:40:04 +0000, Eric Belhomme a écrit:
e me demande donc quelles sont la pratiques fréquemment... pratiquées
par les pros quand ils déploient du RAID6 : hot-spare ou pas hot-spare ?
et si hot-spare, pourquoi ? Par habitude, ou bien y a t'il une vraie
raison technique ?
En tant que pro, je déploie du RAID-6 avec hot spare. L'idée est de
minimiser la durée de protection réduite... Puis on ne peut pas faire
confiance à un utilisateur qui est sensé surveiller, combien de bécanes
j'ai trouvé avec deux disques grillés dans la même grappe? heureusement
il y avait un spare.
--
Writing about music is like dancing about architecture.
Frank Zappa
Le Fri, 09 Apr 2010 15:40:04 +0000, Eric Belhomme a écrit:
e me demande donc quelles sont la pratiques fréquemment... pratiquées par les pros quand ils déploient du RAID6 : hot-spare ou pas hot-spare ? et si hot-spare, pourquoi ? Par habitude, ou bien y a t'il une vraie raison technique ?
En tant que pro, je déploie du RAID-6 avec hot spare. L'idée est de minimiser la durée de protection réduite... Puis on ne peut pas faire confiance à un utilisateur qui est sensé surveiller, combien de bécanes j'ai trouvé avec deux disques grillés dans la même grappe? heureusement il y avait un spare.
-- Writing about music is like dancing about architecture. Frank Zappa
Emmanuel Florac
Le Fri, 09 Apr 2010 20:42:02 +0200, Pascal Hambourg a écrit:
Sans être un spécialiste du stockage, il me semble que le RAID 6 est plutôt utilisé avec un nombre de disques supérieur au RAID 5 et a fortiori au RAID 1. Dans ces conditions, la probabilité que deux disques soient défectueux n'est peut-être plus si négligeable.
Le taux d'erreur des disques SATA (réel, pas celui des fabricants) est de 1 bit sur 10^14. Ça peut paraître important, mais un disque de 1 To contient presque 10^13 bits... Ce qui signifie que lors de la reconstruction d'une grappe de 10 à 12 disques de 1 To (ou 5 à 6 disques de 2 To) on est statistiquement certain d'avoir une erreur... Donc si on est en RAID-5, on est pratiquement certain de ne pas pouvoir reconstruire sans corruption!
-- I have always wished for my computer to be as easy to use as my telephone; my wish has come true because I can no longer figure out how to use my telephone. Bjarne Stroustrup
Le Fri, 09 Apr 2010 20:42:02 +0200, Pascal Hambourg a écrit:
Sans être un spécialiste du stockage, il me semble que le RAID 6 est
plutôt utilisé avec un nombre de disques supérieur au RAID 5 et a
fortiori au RAID 1. Dans ces conditions, la probabilité que deux disques
soient défectueux n'est peut-être plus si négligeable.
Le taux d'erreur des disques SATA (réel, pas celui des fabricants) est de
1 bit sur 10^14. Ça peut paraître important, mais un disque de 1 To
contient presque 10^13 bits... Ce qui signifie que lors de la
reconstruction d'une grappe de 10 à 12 disques de 1 To (ou 5 à 6 disques
de 2 To) on est statistiquement certain d'avoir une erreur... Donc si on
est en RAID-5, on est pratiquement certain de ne pas pouvoir reconstruire
sans corruption!
--
I have always wished for my computer to be as easy to use as my
telephone; my wish has come true because I can no longer figure out
how to use my telephone.
Bjarne Stroustrup
Le Fri, 09 Apr 2010 20:42:02 +0200, Pascal Hambourg a écrit:
Sans être un spécialiste du stockage, il me semble que le RAID 6 est plutôt utilisé avec un nombre de disques supérieur au RAID 5 et a fortiori au RAID 1. Dans ces conditions, la probabilité que deux disques soient défectueux n'est peut-être plus si négligeable.
Le taux d'erreur des disques SATA (réel, pas celui des fabricants) est de 1 bit sur 10^14. Ça peut paraître important, mais un disque de 1 To contient presque 10^13 bits... Ce qui signifie que lors de la reconstruction d'une grappe de 10 à 12 disques de 1 To (ou 5 à 6 disques de 2 To) on est statistiquement certain d'avoir une erreur... Donc si on est en RAID-5, on est pratiquement certain de ne pas pouvoir reconstruire sans corruption!
-- I have always wished for my computer to be as easy to use as my telephone; my wish has come true because I can no longer figure out how to use my telephone. Bjarne Stroustrup
Eric Belhomme
Emmanuel Florac wrote:
En tant que pro, je déploie du RAID-6 avec hot spare. L'idée est de minimiser la durée de protection réduite... Puis on ne peut pas faire confiance à un utilisateur qui est sensé surveiller, combien de bécanes j'ai trouvé avec deux disques grillés dans la même grappe? heureusement il y avait un spare.
plus amusant : j'ai cassé un RAID5 en statut optimal _avec_ disque hot-spare (sur mon SATABoy justement) pour le reconstruire en RAID6 sans hot-spare... Il est tout de suite tombé en mode dégradé : le disque hot-spare etait mort !
J'ai d'ailleurs été étonné que le contrôleur ne l'ai pas détécté, mais bon, j'ai pas l'historique de la machine, et si ca se trouve le disque est cuit depuis 3 ans et n'a jamais été changé...
-- Rico
Emmanuel Florac wrote:
En tant que pro, je déploie du RAID-6 avec hot spare. L'idée est de
minimiser la durée de protection réduite... Puis on ne peut pas faire
confiance à un utilisateur qui est sensé surveiller, combien de bécanes
j'ai trouvé avec deux disques grillés dans la même grappe? heureusement
il y avait un spare.
plus amusant : j'ai cassé un RAID5 en statut optimal _avec_ disque
hot-spare (sur mon SATABoy justement) pour le reconstruire en RAID6
sans hot-spare... Il est tout de suite tombé en mode dégradé : le
disque hot-spare etait mort !
J'ai d'ailleurs été étonné que le contrôleur ne l'ai pas détécté, mais
bon, j'ai pas l'historique de la machine, et si ca se trouve le disque
est cuit depuis 3 ans et n'a jamais été changé...
En tant que pro, je déploie du RAID-6 avec hot spare. L'idée est de minimiser la durée de protection réduite... Puis on ne peut pas faire confiance à un utilisateur qui est sensé surveiller, combien de bécanes j'ai trouvé avec deux disques grillés dans la même grappe? heureusement il y avait un spare.
plus amusant : j'ai cassé un RAID5 en statut optimal _avec_ disque hot-spare (sur mon SATABoy justement) pour le reconstruire en RAID6 sans hot-spare... Il est tout de suite tombé en mode dégradé : le disque hot-spare etait mort !
J'ai d'ailleurs été étonné que le contrôleur ne l'ai pas détécté, mais bon, j'ai pas l'historique de la machine, et si ca se trouve le disque est cuit depuis 3 ans et n'a jamais été changé...
-- Rico
Emmanuel Florac
Le Fri, 09 Apr 2010 21:07:06 +0000, Eric Belhomme a écrit:
Il est tout de suite tombé en mode dégradé : le disque hot-spare etait mort !
Le disque peut avoir été rejeté du RAID, puis simplement redéclaré en spare. La plupart des erreurs de disques sont transitoires et passent avec un "power cycle" du disque...
-- SCSI is not magic. There are fundamental technical reasons why you have to sacrifice a young goat to your SCSI chain every now and then. John F. Woods
Le Fri, 09 Apr 2010 21:07:06 +0000, Eric Belhomme a écrit:
Il est tout de suite tombé en mode dégradé : le
disque hot-spare etait mort !
Le disque peut avoir été rejeté du RAID, puis simplement redéclaré en
spare. La plupart des erreurs de disques sont transitoires et passent
avec un "power cycle" du disque...
--
SCSI is not magic. There are fundamental technical reasons why you have
to sacrifice a young goat to your SCSI chain every now and then.
John F. Woods
Le Fri, 09 Apr 2010 21:07:06 +0000, Eric Belhomme a écrit:
Il est tout de suite tombé en mode dégradé : le disque hot-spare etait mort !
Le disque peut avoir été rejeté du RAID, puis simplement redéclaré en spare. La plupart des erreurs de disques sont transitoires et passent avec un "power cycle" du disque...
-- SCSI is not magic. There are fundamental technical reasons why you have to sacrifice a young goat to your SCSI chain every now and then. John F. Woods
Eric Belhomme
Emmanuel Florac wrote:
Le disque peut avoir été rejeté du RAID, puis simplement redéclaré en spare. La plupart des erreurs de disques sont transitoires et passent avec un "power cycle" du disque...
Là il etait bel et bien mort : je l'ai branché avec un adaptateur sata->usb et mon dmesg a été sans appel !
-- Rico
Emmanuel Florac wrote:
Le disque peut avoir été rejeté du RAID, puis simplement redéclaré en
spare. La plupart des erreurs de disques sont transitoires et passent
avec un "power cycle" du disque...
Là il etait bel et bien mort : je l'ai branché avec un adaptateur
sata->usb et mon dmesg a été sans appel !
Le disque peut avoir été rejeté du RAID, puis simplement redéclaré en spare. La plupart des erreurs de disques sont transitoires et passent avec un "power cycle" du disque...
Là il etait bel et bien mort : je l'ai branché avec un adaptateur sata->usb et mon dmesg a été sans appel !
-- Rico
Olivier B.
On 09 Apr 2010 20:54:53 GMT, Emmanuel Florac wrote:
Le Fri, 09 Apr 2010 20:42:02 +0200, Pascal Hambourg a écrit:
Sans être un spécialiste du stockage, il me semble que le RAID 6 est plutôt utilisé avec un nombre de disques supérieur au RAID 5 et a fortiori au RAID 1. Dans ces conditions, la probabilité que deux disques soient défectueux n'est peut-être plus si négligeable.
Le taux d'erreur des disques SATA (réel, pas celui des fabricants) est de 1 bit sur 10^14. Ça peut paraître important, mais un disque de 1 To contient presque 10^13 bits... Ce qui signifie que lors de la reconstruction d'une grappe de 10 à 12 disques de 1 To (ou 5 à 6 disques de 2 To) on est statistiquement certain d'avoir une erreur... Donc si on est en RAID-5, on est pratiquement certain de ne pas pouvoir reconstruire sans corruption!
peux-tu expliquer exactement de quel taux d'erreur tu parles ? (a quel niveau, transparent ou signalé...)
-- pas de turlututu. apres l'@robase
On 09 Apr 2010 20:54:53 GMT, Emmanuel Florac <eflorac@imaginet.fr>
wrote:
Le Fri, 09 Apr 2010 20:42:02 +0200, Pascal Hambourg a écrit:
Sans être un spécialiste du stockage, il me semble que le RAID 6 est
plutôt utilisé avec un nombre de disques supérieur au RAID 5 et a
fortiori au RAID 1. Dans ces conditions, la probabilité que deux disques
soient défectueux n'est peut-être plus si négligeable.
Le taux d'erreur des disques SATA (réel, pas celui des fabricants) est de
1 bit sur 10^14. Ça peut paraître important, mais un disque de 1 To
contient presque 10^13 bits... Ce qui signifie que lors de la
reconstruction d'une grappe de 10 à 12 disques de 1 To (ou 5 à 6 disques
de 2 To) on est statistiquement certain d'avoir une erreur... Donc si on
est en RAID-5, on est pratiquement certain de ne pas pouvoir reconstruire
sans corruption!
peux-tu expliquer exactement de quel taux d'erreur tu parles ?
(a quel niveau, transparent ou signalé...)
On 09 Apr 2010 20:54:53 GMT, Emmanuel Florac wrote:
Le Fri, 09 Apr 2010 20:42:02 +0200, Pascal Hambourg a écrit:
Sans être un spécialiste du stockage, il me semble que le RAID 6 est plutôt utilisé avec un nombre de disques supérieur au RAID 5 et a fortiori au RAID 1. Dans ces conditions, la probabilité que deux disques soient défectueux n'est peut-être plus si négligeable.
Le taux d'erreur des disques SATA (réel, pas celui des fabricants) est de 1 bit sur 10^14. Ça peut paraître important, mais un disque de 1 To contient presque 10^13 bits... Ce qui signifie que lors de la reconstruction d'une grappe de 10 à 12 disques de 1 To (ou 5 à 6 disques de 2 To) on est statistiquement certain d'avoir une erreur... Donc si on est en RAID-5, on est pratiquement certain de ne pas pouvoir reconstruire sans corruption!
peux-tu expliquer exactement de quel taux d'erreur tu parles ? (a quel niveau, transparent ou signalé...)
-- pas de turlututu. apres l'@robase
Emmanuel Florac
Le Sat, 10 Apr 2010 08:43:50 +0200, Olivier B. a écrit:
peux-tu expliquer exactement de quel taux d'erreur tu parles ? (a quel niveau, transparent ou signalé...)
Le taux d'erreur irrécupérable en lecture. C'est à dire qui ne peut être corrigé par les mécanismes de correction du disque. Il devrait y avoir une amélioration importante avec les nouveaux disques à blocs de 4K, mais pour l'instant on en est là.
-- Never ascribe to malice that which is adequately explained by incompetence. Hanlon's Razor.
Le Sat, 10 Apr 2010 08:43:50 +0200, Olivier B. a écrit:
peux-tu expliquer exactement de quel taux d'erreur tu parles ? (a quel
niveau, transparent ou signalé...)
Le taux d'erreur irrécupérable en lecture. C'est à dire qui ne peut être
corrigé par les mécanismes de correction du disque. Il devrait y avoir
une amélioration importante avec les nouveaux disques à blocs de 4K, mais
pour l'instant on en est là.
--
Never ascribe to malice that which is adequately explained by
incompetence.
Hanlon's Razor.
Le Sat, 10 Apr 2010 08:43:50 +0200, Olivier B. a écrit:
peux-tu expliquer exactement de quel taux d'erreur tu parles ? (a quel niveau, transparent ou signalé...)
Le taux d'erreur irrécupérable en lecture. C'est à dire qui ne peut être corrigé par les mécanismes de correction du disque. Il devrait y avoir une amélioration importante avec les nouveaux disques à blocs de 4K, mais pour l'instant on en est là.
-- Never ascribe to malice that which is adequately explained by incompetence. Hanlon's Razor.
Olivier B.
On 10 Apr 2010 08:27:02 GMT, Emmanuel Florac wrote:
Le Sat, 10 Apr 2010 08:43:50 +0200, Olivier B. a écrit:
peux-tu expliquer exactement de quel taux d'erreur tu parles ? (a quel niveau, transparent ou signalé...)
Le taux d'erreur irrécupérable en lecture. C'est à dire qui ne peut être corrigé par les mécanismes de correction du disque.
c'est bien l'erreur signalée par l'interface du disque et générant sur un jbod une erreur coté systeme genre "crc error retry/abort" ?
Il devrait y avoir une amélioration importante avec les nouveaux disques à blocs de 4K, mais pour l'instant on en est là.
qu'est-ce que la taille du bloc a comme influance ?
-- pas de turlututu. apres l'@robase
On 10 Apr 2010 08:27:02 GMT, Emmanuel Florac <eflorac@imaginet.fr>
wrote:
Le Sat, 10 Apr 2010 08:43:50 +0200, Olivier B. a écrit:
peux-tu expliquer exactement de quel taux d'erreur tu parles ? (a quel
niveau, transparent ou signalé...)
Le taux d'erreur irrécupérable en lecture. C'est à dire qui ne peut être
corrigé par les mécanismes de correction du disque.
c'est bien l'erreur signalée par l'interface du disque et générant sur
un jbod une erreur coté systeme genre "crc error retry/abort" ?
Il devrait y avoir
une amélioration importante avec les nouveaux disques à blocs de 4K, mais
pour l'instant on en est là.
qu'est-ce que la taille du bloc a comme influance ?