Twitter iPhone pliant OnePlus 11 PS5 Disney+ Orange Livebox Windows 11

DD en train de mourrir ? (test SMART)

5 réponses
Avatar
Hugolino
[x-post: fcsp fcolc; fu2: fcsp]


Bonjour

J'ai un portable no-name (enfin si "Airis", une marque espagnole) acheté
chez un assembleur il y a six mois, et je me demande si le disque dur
n'est pas en train de mourrir.

Le bouzin tourne sous Debian Sarge et j'utilise smartmontools 5.32 pour
surveiller le DD (40 Go, marque inconnue).

Il y a un ou deux mois des erreurs sur ma partition /var en ext3 (base
de packages deb corrompue) sont apparues; erreurs réparées par un fsck
(900 Ko dans lost+found)
J'ai alors installé smartmontools qui disait "Device: /dev/hda, 7
Currently unreadable (pending) sectors" (le nombre vient de passer à 8:
pas bon ça...)

Si je lance un bête 'smartctl -l selftest /dev/hda' ça dit:
8<-----------8<---------8<----------8<----------8<----------8<----------8<
Num Test_Description Status Remaining LifeTime(hours)\
LBA_of_first_error
# 1 Extended offline Completed: read failure 50% 1558 \
37110492
8<-----------8<---------8<----------8<----------8<----------8<----------8<

Bref pas très encourageant, surtout quand je compare avec le même test
sur le DD de mon Desktop, un Maxtor agé de 3 ans: ou les 21 tests se
soldent par "Completed without error" alors que dès le premier test ça
foire sur le portable.

NB: Explication de "Remaining" et "LifeTime"
For each of the most recent twenty-one self-tests, the log shows
the type of test (short or extended, off-line or captive) and the
final status of the test. If the test did not complete suc- cessfully,
then the percentage of the test remaining is shown. The time at which
the test took place, measured in hours of disk lifetime, is also
printed.

Un test plus complet est effectué avec 'smartctl -a /dev/hda', ça
raconte ça ([cut sauvages inside]):
8<-----------8<---------8<----------8<----------8<----------8<----------8<
smartctl version 5.32 Copyright (C) 2002-4 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF INFORMATION SECTION ===
Device Model: IC25N040ATMR04-0
Serial Number: MRG274KBD2JP2P
Firmware Version: MO2OAD4A
Device is: In smartctl database [for details use: -P show]
ATA Version is: 6
ATA Standard is: ATA/ATAPI-6 T13 1410D revision 3a
[...]

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED
WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000b 098 098 062 Pre-fail Always
- 131075
2 Throughput_Performance 0x0005 100 100 040 Pre-fail Offline
- 0
3 Spin_Up_Time 0x0007 194 194 033 Pre-fail Always
- 1
4 Start_Stop_Count 0x0012 098 098 000 Old_age Always
- 3240
5 Reallocated_Sector_Ct 0x0033 100 100 005 Pre-fail Always
- 0
7 Seek_Error_Rate 0x000b 100 100 067 Pre-fail Always
- 0
8 Seek_Time_Performance 0x0005 100 100 040 Pre-fail Offline
- 0
9 Power_On_Hours 0x0012 097 097 000 Old_age Always
- 1745
10 Spin_Retry_Count 0x0013 100 100 060 Pre-fail Always
- 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always
- 355
191 G-Sense_Error_Rate 0x000a 100 100 000 Old_age Always
- 0
192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always
- 57
193 Load_Cycle_Count 0x0012 094 094 000 Old_age Always
- 64155
194 Temperature_Celsius 0x0002 157 157 000 Old_age Always
- 35 (Lifetime Min/Max 13/47)
196 Reallocated_Event_Count 0x0032 100 100 000 Old_age Always
- 58
197 Current_Pending_Sector 0x0022 100 100 000 Old_age Always
- 8
198 Offline_Uncorrectable 0x0008 100 100 000 Old_age Offline
- 0
199 UDMA_CRC_Error_Count 0x000a 200 200 000 Old_age Always
- 0
[Pour expliquer: en gros tout roule tant que VALUE ou WORST n'est pas
sous THRESH, ce qui est le cas]

[...]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 24 occurred at disk power-on lifetime: 1615 hours (67 days + 7 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 06 00 c7 35 e2 Error: UNC 6 sectors at LBA = 0x0235c700 = 37078784

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
25 00 06 00 c7 35 e0 00 03:13:16.200 READ DMA EXT
25 00 04 54 c5 35 e0 00 03:13:16.200 READ DMA EXT
25 00 04 c6 e5 35 e0 00 03:13:16.200 READ DMA EXT
25 00 12 96 e1 35 e0 00 03:13:16.200 READ DMA EXT
25 00 02 c2 e1 35 e0 00 03:13:16.200 READ DMA EXT

[...]
[Il y a encore 4 paquets pour Error 23, 22, 21 et 20]

[...]

SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) \
LBA_of_first_error
# 1 Extended offline Completed: read failure 50% 1558 \
37110492

Warning! SMART Selective Self-Test Log Structure error: invalid SMART checksum.
SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
8<-----------8<---------8<----------8<----------8<----------8<----------8<

Remarque: je ne comprends pas ce que veulent dire les deux dernières
lignes.


Bref:
1) le disque est-il vraiment en train de mourrir ?
2) Avez vous, grace à «Device Model: IC25N040ATMR04-0» identifié le
disque dur ? Si oui, que savez-vous de cette marque (réputation,
fiabilité) ?
3) Y aurait-il d'autres outils de diagnostic disponible ? (Sous tux)


Merci de vos idées là-dessus.

[rappel, fu2: fr.comp.sys.pc]


--
> Il y'a de bonnes docs sur la QoS en ce moment, enfin, dans son cas, je ne
> pense pas que ce soit du fifo de base. Sûrement il y'a t'il déjà des classes
> de définies. Classe gros machin, prioritisé par rapport à la classe petit
> machin ? Reste l'inconnue : Le gros débit est-il favorisé par rapport...

5 réponses

Avatar
Testadura
Hugolino wrote:

:: 1) le disque est-il vraiment en train de mourrir ?
:: 2) Avez vous, grace à «Device Model: IC25N040ATMR04-0» identifié le
:: disque dur ? Si oui, que savez-vous de cette marque (réputation,
:: fiabilité) ?
:: 3) Y aurait-il d'autres outils de diagnostic disponible ? (Sous tux)

avec un surnom pareil, tu aurais au moins pu gogoliser le modèle de disque
dur,
et tu aurais remarqué que c'est un Hitachi (ex IBM) Travelstar de 40 Go à
4200 tr/mn
Des disques durs no name ça n'existe pas
Avatar
Basile Starynkevitch [news]
On 2005-04-07, Hugolino wrote:
[x-post: fcsp fcolc; fu2: fcsp]


Bonjour

J'ai un portable no-name (enfin si "Airis", une marque espagnole) acheté
chez un assembleur il y a six mois, et je me demande si le disque dur
n'est pas en train de mourrir.

Le bouzin tourne sous Debian Sarge et j'utilise smartmontools 5.32 pour
surveiller le DD (40 Go, marque inconnue).

Il y a un ou deux mois des erreurs sur ma partition /var en ext3 (base
de packages deb corrompue) sont apparues; erreurs réparées par un fsck
(900 Ko dans lost+found)
J'ai alors installé smartmontools qui disait "Device: /dev/hda, 7
Currently unreadable (pending) sectors" (le nombre vient de passer à 8:
pas bon ça...)

Si je lance un bête 'smartctl -l selftest /dev/hda' ça dit:
8<-----------8<---------8<----------8<----------8<----------8<----------8<
Num Test_Description Status Remaining LifeTime(hours)
LBA_of_first_error
# 1 Extended offline Completed: read failure 50% 1558
37110492
8<-----------8<---------8<----------8<----------8<----------8<----------8<

Bref pas très encourageant, surtout quand je compare avec le même test
sur le DD de mon Desktop, un Maxtor agé de 3 ans: ou les 21 tests se
soldent par "Completed without error" alors que dès le premier test ça
foire sur le portable.

NB: Explication de "Remaining" et "LifeTime"
For each of the most recent twenty-one self-tests, the log shows
the type of test (short or extended, off-line or captive) and the
final status of the test. If the test did not complete suc- cessfully,
then the percentage of the test remaining is shown. The time at which
the test took place, measured in hours of disk lifetime, is also
printed.

Un test plus complet est effectué avec 'smartctl -a /dev/hda', ça
raconte ça ([cut sauvages inside]):
8<-----------8<---------8<----------8<----------8<----------8<----------8<
smartctl version 5.32 Copyright (C) 2002-4 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF INFORMATION SECTION == > Device Model: IC25N040ATMR04-0
Serial Number: MRG274KBD2JP2P
Firmware Version: MO2OAD4A
Device is: In smartctl database [for details use: -P show]
ATA Version is: 6
ATA Standard is: ATA/ATAPI-6 T13 1410D revision 3a
[...]

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED
WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000b 098 098 062 Pre-fail Always
- 131075
2 Throughput_Performance 0x0005 100 100 040 Pre-fail Offline
- 0
3 Spin_Up_Time 0x0007 194 194 033 Pre-fail Always
- 1
4 Start_Stop_Count 0x0012 098 098 000 Old_age Always
- 3240
5 Reallocated_Sector_Ct 0x0033 100 100 005 Pre-fail Always
- 0
7 Seek_Error_Rate 0x000b 100 100 067 Pre-fail Always
- 0
8 Seek_Time_Performance 0x0005 100 100 040 Pre-fail Offline
- 0
9 Power_On_Hours 0x0012 097 097 000 Old_age Always
- 1745
10 Spin_Retry_Count 0x0013 100 100 060 Pre-fail Always
- 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always
- 355
191 G-Sense_Error_Rate 0x000a 100 100 000 Old_age Always
- 0
192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always
- 57
193 Load_Cycle_Count 0x0012 094 094 000 Old_age Always
- 64155
194 Temperature_Celsius 0x0002 157 157 000 Old_age Always
- 35 (Lifetime Min/Max 13/47)
196 Reallocated_Event_Count 0x0032 100 100 000 Old_age Always
- 58
197 Current_Pending_Sector 0x0022 100 100 000 Old_age Always
- 8
198 Offline_Uncorrectable 0x0008 100 100 000 Old_age Offline
- 0
199 UDMA_CRC_Error_Count 0x000a 200 200 000 Old_age Always
- 0
[Pour expliquer: en gros tout roule tant que VALUE ou WORST n'est pas
sous THRESH, ce qui est le cas]

[...]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DDÚys, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 24 occurred at disk power-on lifetime: 1615 hours (67 days + 7 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 06 00 c7 35 e2 Error: UNC 6 sectors at LBA = 0x0235c700 = 37078784

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
25 00 06 00 c7 35 e0 00 03:13:16.200 READ DMA EXT
25 00 04 54 c5 35 e0 00 03:13:16.200 READ DMA EXT
25 00 04 c6 e5 35 e0 00 03:13:16.200 READ DMA EXT
25 00 12 96 e1 35 e0 00 03:13:16.200 READ DMA EXT
25 00 02 c2 e1 35 e0 00 03:13:16.200 READ DMA EXT

[...]
[Il y a encore 4 paquets pour Error 23, 22, 21 et 20]

[...]

SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours)
LBA_of_first_error
# 1 Extended offline Completed: read failure 50% 1558
37110492

Warning! SMART Selective Self-Test Log Structure error: invalid SMART checksum.
SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
8<-----------8<---------8<----------8<----------8<----------8<----------8<

Remarque: je ne comprends pas ce que veulent dire les deux dernières
lignes.


Bref:
1) le disque est-il vraiment en train de mourrir ?


Oui. J'ai eu le même problème sur un PowerBook 12" sous
Linux/Debian. Ensuite, un message par smartctl du genre "backup all
your data - disk will die within 24 hours". Puis le disque est mort.


2) Avez vous, grace à «Device Model: IC25N040ATMR04-0» identifié le
disque dur ? Si oui, que savez-vous de cette marque (réputation,
fiabilité) ?


Non, et je ne suis pas sûr que ça ait de l'importance. J'ignore ce qui
fait la qualité d'un disque dur pour portable (probablement la
puissance dissipée doit être minimale, à la fois pour moins chauffer
et pour moins consommer et s'user).


3) Y aurait-il d'autres outils de diagnostic disponible ? (Sous tux)



Il y a aussi des messages dans les logs /var/log/messages par
exemple du genre "hda error"

Merci de vos idées là-dessus.


Sauvegardez vos fichiers, et courez acheter un nouveau disque (ou un
nouveau portable). J'ignore si le changement du disque est facile sur
votre portable, mais dorénavant, c'est la première chose que je
regarderais en achetant un tel ordinateur.


--
Basile STARYNKEVITCH http://starynkevitch.net/Basile/
email: basile<at>starynkevitch<dot>net
aliases: basile<at>tunes<dot>org = bstarynk<at>nerim<dot>net
8, rue de la Faïencerie, 92340 Bourg La Reine, France

Avatar
Daria Morgenndorfer
Postez dans fr.comp.stockage
Avatar
l'indien
On Thu, 07 Apr 2005 19:59:03 +0000, Basile Starynkevitch [news] wrote:

On 2005-04-07, Hugolino wrote:
[x-post: fcsp fcolc; fu2: fcsp]

Bonjour



Bonsoir,

[...]

J'ai un portable no-name (enfin si "Airis", une marque espagnole) acheté
chez un assembleur il y a six mois, et je me demande si le disque dur
n'est pas en train de mourrir.
2) Avez vous, grace à «Device Model: IC25N040ATMR04-0» identifié le
disque dur ? Si oui, que savez-vous de cette marque (réputation,
fiabilité) ?


Non, et je ne suis pas sûr que ça ait de l'importance. J'ignore ce qui
fait la qualité d'un disque dur pour portable (probablement la
puissance dissipée doit être minimale, à la fois pour moins chauffer
et pour moins consommer et s'user).


Moi non, mais google le sait, lui:
c'est un Hitachi (IBM) travelstar:
<http://www.hitachigst.com/hdd/support/80gn/80gn.htm&gt;
Mais, en matière de disque dur, il est toujours possible de tirer le
mauvais lot: c'est un composant de grande précision qui allie la
mécanique à l'informatique et l'electronique... Il peut donc facilement
être deffectueux (le plus souvent au niveau mécanique).

En tout cas, même si tu attends le dernier moment pour le remplacer, il
faut se mettre à faire des sauvegardes très régulièrement en attendant
l'issue fatale...

[...]


Avatar
Hugolino
Le Thu, 7 Apr 2005 20:27:04 +0200, Testadura a écrit:
Hugolino wrote:

:: 1) le disque est-il vraiment en train de mourrir ?
:: 2) Avez vous, grace à «Device Model: IC25N040ATMR04-0» identifié le
:: disque dur ? Si oui, que savez-vous de cette marque (réputation,
:: fiabilité) ?
:: 3) Y aurait-il d'autres outils de diagnostic disponible ? (Sous tux)

avec un surnom pareil, tu aurais au moins pu gogoliser le modèle de
disque dur, et tu aurais remarqué que c'est un Hitachi (ex IBM)
Travelstar de 40 Go à 4200 tr/mn


Oui, mes excuses, je n'y ai tout simplement pas pensé.



--
Je cherche une methode pour verifier si le port 515 est a l'ecoute.
Cette requete est a envoyer d'une station Solaris vers un serveur NT.
use Net::TCP; $object = new Net::TCP "playstation", 515;

$ok = $object->connect; -+- SB in Guide du linuxien pervers -+-