Christoph Schnauß: Umgang mit (defekten) Partitionen

hallo Forum,

ich habe an meinen Rechner, auf dem ich wahlweise FreeBSD, SUSE, Gentoo oder WindowsXP fahren kann ("default" ist FreeBSD), eine fünfte Platte angestöpselt mit Hilfe einer Zusatzsteckkarte. Diese Platte hat eine primäre Partition und insgesamt fünf logische Laufwerke in einer Erweiterten Partition, alle sind mit FAT32 formatiert.
Gestern gabs mitten im Betrieb einen ganz leisen Knacks, und der Rechner blieb "stehen" - also Bild eingefroren, keine Reaktion mehr auf Tastatureingaben oder Mausaktionen. Das kenne ich bereits, es müßte dazu sogar einen kleinen Archivthread geben, ich weiß bloß nicht, wonach ich da suchen müßte. Mir blieb zunächst nichts anderes übrig, als buchstäblich den "Stecker zu ziehen". Danach habe ich natürlich nachgeschaut, ob sonst noch alles (bei abgeklemmter Platte) in Ordnung ist - alle Systeme ließen sich problemlos hochfahren und wurden natürlich gründlich überprüft.
Dieser "ganz leise Knacks" bedeutet, daß mitten im Betrieb, und obwohl ich auf die Platte gar nicht zugegriffen habe, irgendwas dort mindestens die Partitionstabelle zerschossen hat, aber die Aussicht, die Daten retten zu können, sehr hoch ist. Heute nachmittag habe ich die Platte also wieder in Betrieb genommen, um die dort gespeicherten Daten woandershin zu kopieren. Mein Bios hat sie auch anstandslos anerkannt. Aber die Systeme verhielten sich extrem unterschiedlich:

  • FreeBSD bootet gewohnt schnell und listet die defekte Platte auch laut dmesg. Es mountet problemlos die dort vorhandene primäre Partition, und ebenso problemlos vier von den fünf logischen Laufwerken, beim Versuch, die fünfte zu mounten, gibts mehrere timeout-Anzeigen. Sehr gut, jetzt wußte ich wenigstens, um welche Partition es ging.
  • Gentoo bootet problemlos und mountet _alle_ Partitionen, nur bei der vermutlich defekten Partition gibts eine leichte Verzögerung.
  • SUSE bootet mit enormer Verzögerung und liefert während des Bootvorgangs nahezu tausend Fehlermeldungen wegen I/O-Fehlern auf der vermutlich defekten Partition. Es dauert etwa zehn Minuten, bis das System gestartet ist. Danach läßt sich von der fraglichen Platte die primäre Partition problemlos mounten, aber keine andere.
  • WindowsXP braucht ziemlich exakt 40 Minuten, um hochzufahren. Danach ist die defekte Platte weder im Windows Explorer noch über den Gerätemanager darstellbar, und das gesamte System leidet unter extremer Verlangsamung.

Ich habe von Gentoo aus mit fdisk die defekte Partition gelöscht (das war eh nur eine kleine Partition für die Auslagerungsdatei, die ganze Partition konnte also gefahrlos vernichtet werden), danach lief alles wieder völlig problemlos mit allen vier Systemen und die Daten der anderen Partitionen auf der problematischen Platte waren alle wieder uneingeschränkt verfügbar. Es scheint, als hätte es tatsächlich nur eine zerschossene Partitionstabelle gegeben, aber keine physikalischen Fehler (Staubkörnchen oder sowas).

Was mich interessiert, ist jetzt zweierlei:
1. Hat jemand eine Erklärung, warum sich eine Platte auf einmal ohne ersichtlichen Grund und vor allem ohne daß gerade auf sie zugegriffen wird, mit defekter Partitionstabelle aus dem Betrieb verabschiedet? Es ist eine reichlich zwei Jahre alte 40 GB große Western Digital. Alle anderen Platten in diesem Rechner sind Maxtor-Platten.
2. Viel interessanter: wieso verhalten sich die Betriebssysteme derart unterschiedlich, was bremst die SUSE aus, und was zwingt Windows zu derart extremer Zurückhaltung?
Nach Löschung der defekten Partition und entprechender Reparatur der Partitionstabelle läuft ja im Moment alles wieder so, wie es laufen soll ...

Grüße aus Berlin

Christoph S.

--
Visitenkarte
ss:| zu:) ls:& fo:) va:) sh:| rl:|
  1. Hallo Christoph,

    1. Hat jemand eine Erklärung, warum sich eine Platte auf einmal ohne ersichtlichen Grund und vor allem ohne daß gerade auf sie zugegriffen wird, mit defekter Partitionstabelle aus dem Betrieb verabschiedet? Es ist eine reichlich zwei Jahre alte 40 GB große Western Digital.

    aha, eine WD. Das ist doch schon Grund genug.
    Nee, mal ganz im Ernst: Ich habe in meinen eigenen Rechnern und auch in den PCs von Kollegen in der Firma in den letzten Jahren sechs Festplattentode miterlebt. Fünf davon waren Western Digital, eine von IBM. Dadurch habe ich mittlerweile ein sehr gestörtes Verhältnis zu WD-Platten: Ich traue ihnen nicht weiter als ich sie werfen kann.

    1. Viel interessanter: wieso verhalten sich die Betriebssysteme derart unterschiedlich, was bremst die SUSE aus, und was zwingt Windows zu derart extremer Zurückhaltung?

    Meine Diagnose von hier aus, die sich natürlich auf Mutmaßungen stützt, ist folgende: Die Platte hat -wodurch auch immer- einen physikalischen Defekt erlitten, der einige Sektoren in der FAT oder den Verzeichnisstrukturen der nun verlorenen Partition umfasst. Jedes Betriebssystem überprüft die verfügbaren Partitionen beim Starten/Mounten unterschiedlich gründlich. Windows versucht zum Beispiel krampfhaft, die FAT zu lesen, damit es das Root-Verzeichnis lokalisieren kann, um dort wiederum nachzusehen, ob da eine autorun.inf liegt, die ein benutzerdefiniertes Icon für die Partition festlegt. Vielleicht versucht Windows sogar, ein scandisk auf dem Laufwerk zu machen, weil die Informationen aus Bootsektor und FAT widersprüchlich sind.
    Gentoo ist anscheinend das andere Extrem; dieses System gibt sich beim Booten/Mounten wahrscheinlich mit der Information zufrieden, dass die Partition existiert, alles weitere kann man beim ersten Zugriff noch erörtern. Die anderen Systeme machen wohl auch mehr oder weniger ausführliche Checks.

    Nach Löschung der defekten Partition und entprechender Reparatur der Partitionstabelle läuft ja im Moment alles wieder so, wie es laufen soll ...

    Aber ich vermute, dass es dir nicht mehr gelingt, die Partition wieder anzulegen und zu formatieren. Da ist der Wurm drin, nehme ich an. Wenn Platten hörbar irgendein Problem haben, ist es meist ein endgültiges. Ich würde die Platte auch sicherheitshalber einmotten oder ihr zumindest nichts Wichtiges mehr anvertrauen.

    Schönen Abend noch,
     Martin

    --
    Ich wollt', ich wär ein Teppich. Dann könnte ich morgens liegenbleiben.
    1. hallo,

      ich vermute, dass es dir nicht mehr gelingt, die Partition wieder anzulegen und zu formatieren.

      Doch, das ging ruckzuck.

      Ich würde die Platte auch sicherheitshalber einmotten oder ihr zumindest nichts Wichtiges mehr anvertrauen.

      Das ist schon klar - übrigens hätte ich auch weiterleben können, wenn sie nicht mehr reaktivierbar gewesen wäre. Ich stimme dir auch zu, was die Skepsis gegenüber Western Digital angeht. Bei mir sind _alle_ Platten, die jemals Probleme verursacht haben, WD-Platten gewesen. Im übrigen gibt es auch Prüfmöglichkeiten für (physisch) defekte Sektoren. Es sind auf meiner Problemplatte keine zu finden. Aber du hast recht: bei jeder mir bisher bekannten Formatierung werden defekte Sektoren ganz einfach als "unbeschreibbar" markiert und ausgelassen. Ich habe in einem anderen Rechner eine tatsächlich physisch defekte Platte (Samsung), von deren 80 GB nur noch 36 GB nutzbar sind. Das aber schon seit mehreren Jahren. Da lasse ich natürlich keine "sensiblen" oder anderswie wichtigen Daten drauf, aber ich lasse sie interessehalber mitlaufen, weil ich gerne wissen möchte, wie lange eine tatsächlich physisch defekte Platte trotzdem in Betrieb bleiben kann.

      Deine Mutmaßungen über die Umgangsarten der Systeme mit solchen Defekten genügen mir aber noch nicht - sorry. Ich habe den Thread deshalb gestartet, weil mir "sowas" nicht zum erstenmal passiert ist. Nur habe ich diesmal bewußt etwas umfangreicher meine Systeme drauflosgelassen und mir mal ein paar Sachen dazu notiert. Wenns nicht hilft, schadet es doch zumindest nix, sich das mal gründlicher zu notieren und den Versuch einer etwas genaueren Analyse zu unternehmen. Und wieso kann mir eine Platte, auf die ich grade gar nicht zugreife, mitten im laufenden Rechnerbetrieb so einfach "aussteigen"? Daß ich das doof finde, ist sicher verständlich, aber das erklärt nunmal gar nichts ...

      Und mit Verlaub: ich glaube, daß Vergleichbares auch dem einen oder anderen Forumsbesucher mal passiert ist oder passieren kann.

      Schönen Abend noch

      Danke, ich muß mir grade die (FreeBSD-)Welt neu erschaffen ;-)

      Grüße aus Berlin

      Christoph S.

      --
      Visitenkarte
      ss:| zu:) ls:& fo:) va:) sh:| rl:|
      1. Hi Christoph,

        ich vermute, dass es dir nicht mehr gelingt, die Partition wieder anzulegen und zu formatieren.
        Doch, das ging ruckzuck.

        boah, das hätte ich nicht gedacht.

        Wenn dir meine Vermutungen nicht fundiert genug sind, irgendwie zu schwammig, dann ist das okay - liegt natürlich auch daran, dass ich mich mit den Eigenheiten von Unix/Linux-Systemen nicht besonders auskenne.

        Wenn wir davon abgesehen ungefähr auf einer Wellenlänge liegen, ist das in Ordnung, und dass du das Thema jetzt eher akademisch als pragmatisch anpackst, war mir anhand deines Ursprungspostings nicht so klar. Nichtsdestotrotz halte ich es auch für hochinteressant und bleibe dran, denn es interessiert mich auch, was andere dazu noch beitragen können.

        Ich stimme dir auch zu, was die Skepsis gegenüber Western Digital angeht. Bei mir sind _alle_ Platten, die jemals Probleme verursacht haben, WD-Platten gewesen.

        Hochinteressant. Die meisten, mit denen ich bisher darüber gesprochen habe, haben WD über den grünen Klee gelobt.

        Und wieso kann mir eine Platte, auf die ich grade gar nicht zugreife, mitten im laufenden Rechnerbetrieb so einfach "aussteigen"?

        Tja... weißt du, was eine Festplatte mit eigenem Controller (IDE, vermute ich) so alles in Eigenregie anstellt, wenn sie von ihrem Host gerade nicht angesprochen wird?
        In meinem Desktop-Rechner steckt z.B. eine 80GB Seagate, die regelmäßig nach einigen Minuten Ruhe von selbst anfängt, hörbare Aktivitäten zu zeigen. Sie rast los, gerade so wie es sich bei größeren Kopieraktionen anhört, aber die LED bleibt aus, es ist also eine rein interne Sache, ist auch unabhängig vom gerade aktiven Betriebssystem (Win2k/DOS7). Sobald ein Zugriff auf die Platte erfolgt, ist erstmal wieder Ruhe; nach ein bis zwei Minuten beruhigt sie sich auch von ganz allein wieder. Das zeigt aber, dass manche IDE-Platten sehr wohl ein Eigenleben führen, das vom Hostsystem unabhängig ist.

        Und mit Verlaub: ich glaube, daß Vergleichbares auch dem einen oder anderen Forumsbesucher mal passiert ist oder passieren kann.

        Natürlich, jederzeit.

        So long,
         Martin

        Danke, ich muß mir grade die (FreeBSD-)Welt neu erschaffen ;-)

        *g* Gestatten: Bond. James Bond. Entschuldigen Sie mich bitte, ich muss mal eben die Welt retten.  ;-)

        --
        Die meisten Menschen werden früher oder später durch Computer ersetzt.
        Für manche würde aber auch schon ein einfacher Taschenrechner genügen.
      2. Servus,

        Ich habe in einem anderen Rechner eine tatsächlich physisch defekte Platte (Samsung), von deren 80 GB nur noch 36 GB nutzbar sind.

        Bei einer neuen Samsung-Platte hatte ich mal das gleiche Problem - gerade 36 GB statt 120 GB verfügbar. Das war (bei mir) kein Plattendefekt, sondern ein falsch gesetzter Jumper. Auf dem Gehäuse der Platte war eine kleiner Aufkleber, auf dem zu sehen war, dass der Jumper für den Slave-Mode in die zweite Position von links muss, also so:
        .o..
        .o..
        Ich hoffe, man kann es erkennen...
        Nur auf einem kleinen Zettel, der noch dabei war, hab ich später dann gesehen, dass Samsung-Platten diesen speziellen Modus haben, damit man auch ein OS installieren kann, das mit größeren Partitionen nicht klar kommt.
        Lange Rede, kurzer Sinn: Die richtige Slave-Einstellung war die, den Jumper ganz weg zu lassen und dann hatte die Platte auch ihre richtige Größe.

        1. hallo Josh,

          Bei einer neuen Samsung-Platte hatte ich mal das gleiche Problem - gerade 36 GB statt 120 GB verfügbar. Das war (bei mir) kein Plattendefekt, sondern ein falsch gesetzter Jumper.

          Interssanter Hinweis. Trifft allerdings bei meiner Samsung-Platte nicht zu, die hat tatsächlich defekte Sektoren, und der Jumper sitzt korrek.

          Auf dem Gehäuse der Platte war eine kleiner Aufkleber

          Ja, auf meiner ist auch einer, und den kenn ich ;-)

          Grüße aus Berlin

          Christoph S.

          --
          Visitenkarte
          ss:| zu:) ls:& fo:) va:) sh:| rl:|