Est-ce que les données sur un disque dur se dégradent sans Windows m'avoir averti que cela s'est produit lorsque j'essaie d'accéder aux données?

Est-il probable qu'une dégradation physique d'un disque dur pourrait provoquer des bits pour «flip» dans le contenu du fichier sans que le système d'exploitation ne se remarque et vous en parler lors de la lecture du fichier? Par exemple, un 'p' dans un fichier texte ASCII (binaire 0111000 0 ) passe à 'q' (0111000 1 ) et un utilisateur (moi) peut ouvrir le fichier et voir 'q' sans être conscient qu'un échec s'est produit?

Je suis intéressé par les réponses concernant FAT, NTFS ou ReFS … si cela fait une différence.

Je veux savoir si le système d'exploitation m'en protège, ou si je vérifie mes données pour l'invariance entre les copies / au fil du temps.

Oui , il y a une chose appelée bit put.

Mais non , cela ne vous affectera pas inaperçu.

Lorsqu'un lecteur écrit un secteur dans les plateaux, il ne suffit pas d'écrire les bits de la même façon qu'ils sont stockés dans la RAM – il utilise un codage pour s'assurer qu'il n'y a pas de séquences du même bit trop longues , Et il ajoute des codes ECC, qui lui permettent de réparer les erreurs qui affectent quelques bits et de détecter les erreurs qui affectent plus de quelques bits.

Lorsque le lecteur lit le secteur, il vérifie ces codes ECC et répare les données, si nécessaire et possible. Ce qui se passe ensuite dépend des circonstances et du firmware du lecteur, qui est influencé par la désignation du lecteur.

  • Si un secteur peut être lu et n'a pas de problèmes ECC, il est transmis au système d'exploitation
  • Si un secteur peut être réparé facilement, la version réparée peut être écrite sur le disque, lire et vérifier, afin de déterminer si l'erreur était aléatoire (rayons cosmiques …) ou s'il y a une erreur systématique avec les médias
  • Si le lecteur détermine qu'il y a une erreur avec les médias, il réaffecte le secteur
  • Si un secteur ne peut être ni lu ni corrigé après quelques tentatives de lecture, sur un lecteur désigné comme un lecteur RAID , le lecteur abandonnera, réaffectera le secteur et informera le contrôleur qu'il y a eu un problème. Il s'appuie sur le contrôleur RAID pour reconstruire le secteur des autres membres RAID, et l'écrire à nouveau sur le disque défaillant, ce qui le stocke dans le secteur réaffecté, ce qui, espérons-le, n'a pas le problème.
  • Si un secteur ne peut pas être lu ou corrigé sur un lecteur de bureau , le lecteur tentera beaucoup plus de le lire. En fonction de la qualité du lecteur, cela implique le repositionnement de la tête, en vérifiant s'il y a des bits qui retournent lorsqu'ils sont lus à plusieurs reprises, en vérifiant les bits les plus faibles et quelques autres choses. Si l'une de ces tentatives réussit, le disque réaffecte le secteur et écrivez les données réparées.

(Ceci est l'une des principales différences entre les lecteurs vendus sous le nom de "Desktop", "NAS / RAID" ou "Video surveillance". Un lecteur RAID peut simplement abandonner rapidement et faire en sorte que le contrôleur répare le secteur pour éviter la latence sur le Un lecteur de bureau réessaye encore et encore, parce que l'utilisateur attend quelques secondes probablement mieux que de leur dire que les données sont perdues. Et un lecteur vidéo valorise le taux de données constant plus que la récupération d'erreur, car un cadre endommagé a généralement gagné Je vais même être remarqué.)

Quoi qu'il en soit, le lecteur saura s'il y a eu un pourriture des morceaux, il en récupérera généralement, et si ce n'est pas le cas, il indiquera au contrôleur qui indiquera le pilote qui lui dira le système d'exploitation. Ensuite, il appartient au système d'exploitation de présenter cette erreur à l'utilisateur et d'agir à ce sujet. C'est pourquoi cybernard dit

Je n'ai jamais été témoin d'une seule erreur, mais j'ai vu beaucoup de disques durs où des secteurs entiers ont échoué.

Le lecteur saura qu'il y a quelque chose qui ne va pas avec le secteur, mais il ne sait pas quels bits ont échoué. (Un seul bit qui a échoué sera toujours pris en charge par ECC).

Notez que chkdsk et la réparation automatique des systèmes de fichiers ne traitent pas de la réparation des données dans les fichiers. Ceux-ci visent la corruption dans la structure du système de fichiers; Comme une taille de fichier différente entre l'entrée du répertoire et le nombre de blocs alloués. La fonctionnalité d'auto-guérison de NTFS détecte les dommages structurels et les empêche d'affecter davantage vos données; elles ne répareront pas les données déjà endommagées.

Il y a bien sûr d'autres raisons pour lesquelles les données peuvent être endommagées. Par exemple. Une mauvaise RAM sur un contrôleur peut altérer les données avant même d'être envoyée au lecteur. Dans ce cas, aucun mécanisme sur le lecteur ne détecte ou ne réparera les données, et ce peut être une des raisons pour lesquelles la structure d'un système de fichiers est endommagée. D'autres raisons incluent des bogues logiciels simples, une panne de courant lors de l'écriture du disque (bien que cela soit abordé par journalisation du système de fichiers) ou de mauvais systèmes de fichiers (le pilote NTFS sous Linux a été défini en lecture seule pendant longtemps, car NTFS a été conçu en rétro-ingénierie, non documenté , Et les développeurs n'ont pas fait confiance à leur propre code).

J'ai eu ce scénario une fois, où une application enregistrait tous ses fichiers dans deux serveurs différents dans différents centres de données, afin de conserver une copie de travail si les données étaient en tout état de cause. Après quelques mois, nous avons remarqué que sur l'une des copies, environ 0,1% de tous les fichiers ne correspondaient pas à la somme MD5 que l'application stockait dans sa base de données. Il s'est avéré être un câble fibreux défectueux entre le serveur et le SAN.

Ces autres raisons expliquent pourquoi certains systèmes de fichiers, comme ZFS, contiennent des informations supplémentaires sur la somme de contrôle pour détecter les erreurs. Ils sont conçus pour vous protéger de beaucoup plus de choses qui peuvent se passer de la pudique.

Oui, les disques durs peuvent et se dégradent sans avertissement du système d'exploitation. C'est ce qu'on appelle la pourriture des morceaux . Je n'ai jamais été témoin d'une seule erreur, mais j'ai vu beaucoup de disques durs où des secteurs entiers ont échoué.

Windows n'a pas de protection intégrée du contenu du fichier au-delà de la structure du système de fichiers NTFS. Pensez à NTFS en tant que livre: bien, il ne protège que la table des matières et vérifie que les choses correspondent. Cependant, si le dommage se trouve au milieu d'une page, il n'offre aucune protection. FAT n'a rien. Les disques durs utilisent la correction d'erreur ECC par secteur, mais le lecteur ne dit pas à Windows. Certains types de fichiers ont spécifiquement des crochets CRC, MD5 ou SHA pour détecter la corruption, mais ils ne corrigent rien.

Même alors, le hash ne vous dit qu'un problème, mais il ne sait pas où se trouve l'erreur.

Le disque dur a SMART qui surveille la santé du disque dur, mais à moins que le lecteur soit sur la porte de la mort, le BIOS ne vous avertira pas. Le pire encore, SMART est souvent désactivé par défaut dans votre BIOS. Vous pouvez surveiller les numéros via un logiciel, mais différents lecteurs ont des problèmes différents. Si vous avez un groupe de secteurs relocalisés, ou si vos erreurs ECC augmentent constamment. Si vous avez 100 000 nouveaux ECC tous les jours, c'est un mauvais signe.

De nombreux types de fichiers n'ont aucune protection contre la pourriture des morceaux . Comme, TXT et BMP, qui n'ont aucune protection. Winrar a une option optionnelle pour ajouter des données de parité à l'archive, ce qui rendra le fichier plus grand, mais il peut détecter (proportionnellement à la quantité de données ajoutées ajoutées) et réparer ce type d'erreur.

Tous les autres programmes de compression que je connais détectent des erreurs, mais sont impuissants à faire quelque chose à ce sujet.

Finalement, les erreurs dans un secteur seront si mauvaises que ECC ne peut pas le corriger, et le lecteur vous donnera ce qu'il lit même s'il est faux.

Vous pouvez utiliser QuickPar ou similaire pour créer des fichiers de données de parité, mais pour autant que je sache, il n'y a aucun moyen de l'automatiser. Par exemple, vous modifiez le fichier vous-même lorsque vous devez mettre à jour manuellement la parité. Vous pouvez également avoir des données de parité pour un groupe de fichiers, mais vous changez 1 fichier et l'ensemble de parité doit être recréé. C'est un véritable mal de tête pour tous, mais un petit nombre de fichiers.

Oui c'est possible. Windows est juste un logiciel. Le logiciel est une série d'instructions pour un ordinateur à suivre.

Pensez à un autre type d'une série d'instructions: un livre. Comment ces instructions peuvent-elles s'accomplir si elles sont écrites dans un livre assis sur une étagère et que personne ne dérange pour ouvrir le livre et lire ces instructions?

Tout comme ces instructions écrites obligent une personne à lire les instructions et à suivre les instructions, les logiciels nécessitent du matériel pour faire des choses utiles. Même si un livre a des instructions qui ont été écrites avec une précision fabuleuse, cela n'empêche pas les problèmes si une personne décide de lire les instructions, mais ensuite de les mettre en échec. De même, les logiciels ne peuvent empêcher le matériel de faire de mauvaises choses. Ainsi, le matériel brisé peut triompher physiquement de ce que n'importe quel logiciel peut faire, y compris Microsoft Windows.

Maintenant, ReFS peut être conçu avec l'intention que le logiciel stocke les détails sur les données et que le logiciel compare ces détails plus tard. Un concept simple est «checksum», où le logiciel ajoute certaines valeurs et s'assure que ces valeurs correspondent à un résultat attendu. Lorsque le matériel implémente ce logiciel, certains mauvais résultats peuvent être détectés. Cela peut même être très probable à travailler. Toutefois, étant donné que le nombre de problèmes potentiels, qui pourraient exister théoriquement, est essentiellement un nombre infini, rien ne garantit que le logiciel détectera nécessairement tous les problèmes. (Gardez à l'esprit que le logiciel est une série d'instructions qui ont été créées à l'avance.)

FAT est particulièrement faible sur les fonctionnalités. FAT12 a été conçu pour les disquettes, et FAT16 pour les systèmes jusqu'à 4 Go (bien que la majeure partie de la mise en œuvre de Microsoft FAT16 ait tendance à ne pas fonctionner au-dessus de 2 Go). Sans l'extension VFAT, aucun d'entre eux n'a supporté de noms de fichiers de plus de 11 caractères (dont certains seraient dans une partie appelée «extension»). FAT a simplement été conçu pour stocker des données dans un moment où la capacité de stocker des données était un concept nouveau sur lequel les adultes devaient être enseignés. Lorsque FAT a été considérée comme une technologie «de pointe», la technologie informatique n'était pas encore suffisamment répandue et élaborée pour que les gens s'inquiètent des fonctionnalités avancées.

NTFS a ajouté un support pour certaines fonctionnalités supplémentaires, peut-être notamment si le système d'exploitation pouvait facilement suivre les autorisations des utilisateurs. Il existe différentes versions de NTFS. Par exemple, Moab souligne que Windows Server 2008 a ajouté un support pour la réparation automatique de NTFS , qui peut détecter certaines choses. Pourtant, cette fonctionnalité était nouvelle pour Windows Server 2008, donc ce n'est pas quelque chose pris en charge par Windows XP (ou Windows Server 2003, ou plus tôt). Même encore, en regardant la liste des fonctionnalités, il semble que cela implique des méta-données qui aident le système d'exploitation à remarquer des problèmes si graves que le disque ne peut pas monter ou d'autres zones clés du disque qui affectent le noyau du système d'exploitation. Il ne semblait pas que chaque donnée unique, dans chaque fichier, soit affectée par cette caractéristique particulière.

Le logiciel pour de tels systèmes d'exploitation est extrêmement improbable de constater ces choses, à moins qu'elles ne provoquent des problèmes notables pour le système d'exploitation pour accomplir des tâches. Il peut y avoir quelques exceptions, comme les parties du système d'exploitation qui vérifient les disques (CheckDsk / ChkDsk / ScanDisk / ScanDskW, selon le système d'exploitation), mais même ils seront plutôt limités sur ce qu'ils peuvent détecter, en grande partie parce que les systèmes de fichiers ne "T stocker une très grande quantité de données qui était destiné à être utile pour la vérification des disques.

(RAID5 pourrait être plus enclin à détecter de telles choses, chaque bit ayant un bit de parité qui aiderait à remarquer quelque chose d'inhabituel. Même alors, il appartiendrait à l'implémentation RAID d'exécuter une vérification pour constater le problème. Si le problème s'est produit sur Une partie du disque qui ne fonctionne pas activement, le problème peut rester inaperçu jusqu'à ce que quelqu'un tente de commencer à utiliser ces données.)

Plus récemment, un plus grand nombre de bits signifiait que de faibles probabilités, comme les chances de «1 sur 10 millions», étaient plus susceptibles d'affecter les choses. Le grand public a également appris sur les «rayons cosmiques», ce qui peut avoir un faible impact sur les choses. Étant donné que les bits sont entassés si étroitement dans les nouveaux appareils, les exigences physiques pour représenter un peu sont plus petites, de sorte que même de petits impacts sont plus susceptibles de faire un geste avec la façon dont un peu est reconnu. ReFS dispose de certaines fonctionnalités conçues pour les aider à être détectées. L'article de Wikipédia sur ReFS se réfère à ceci comme "vérification automatique de l'intégrité". Comme cela est décrit comme une caractéristique notable de ce système de fichiers, ces fonctionnalités sont probablement plus développées qu'avec NTFS (et certainement plus que la FAT, qui était de nature relativement simple, et donc pratiquement aucune fonctionnalité de ce type).