[NEWSboard IBMi Forum]

Thema: Plattenwunder

  1. #1
    Registriert seit
    Aug 2006
    Beiträge
    2.077

    Plattenwunder

    Hallo *all,

    meine Backup AS/400 meckerte die ganze Zeit das eine Platte defekt sei. Ein Rebuild des Raids hat nicht gebracht. Habe mir den Spaß ein paar Tage angesehen und als die Warnungen über einen Ausfall immer drastischer wurden,

    Code:
    Nachrichten-ID . . . . :   CPP1604       Bewertung  . . . . . . :   90        
    Nachrichtenart . . . . :   Information                                        
    Sendedatum . . . . . . :   08.04.17      Sendezeit  . . . . . . :   22:26:16  
                                                                                  
    Nachricht . . . :   *Achtung*  Drohender DASD-Fehler. Den Hardwareservicegeber
      sofort verständigen.                                                        
    Ursache  . . . . :  Interne Messungen an Platteneinheit DD004 zeigen an, dass 
      bald ein nichtbehebbarer Fehler, der zu Datenverlust führt, auftreten wird.
    dachte ich mir kaufste ne neue Platte. Gesagt getan.
    Platte kam am Freitag an und ich dachte ok baust du sie am Montag ein.

    Das RWE war aber am Samstag so nett unsere 10 KV Leitung für eine Stunde zu unterbrechen und da die AS/400 keinen Notstrom hatte fiel sie auf die Nase.

    Nachdem ich die Kiste wieder neugestartet hatte war auf wundersamme Weise das Raid wieder in Ordnung.
    Sachen gibts......

    Mal schauen wie lange das hält...... Weil kaputt ist ja eigentlich kaputt.

    GG 4799

  2. #2
    Registriert seit
    Dec 2014
    Beiträge
    310
    Der Screenshot zeigt aber KEINEN Raid-Fehler sondern bedeutet "nur", dass möglicherweise unter Umständen eventuell ... eine Platte bald ausfallen KÖNNTE.
    Das Raid selbst hat aber sicher funktioniert (weil alle Platten noch funktionsfähig!)

    Das ist übrigens mittlerweile ein bekannter Fehler - dafür gibt's sogar ein PTF ... da die IBM meint, dass die interne Plattenprüfung zu "sensibel" reagiert ...
    (habe bis jetzt aber bei jedem Kunden, wo dieser Fehler auftrat, die Platte vorsichtshalber tauschen lassen - was auch anstandslos gemacht wurde - Wartungsvertrag vorausgesetzt.)

  3. #3
    Registriert seit
    Aug 2006
    Beiträge
    2.077
    Danke für den Hinweis ;-)

    Aber ich mache ja bei so einem Bild keinRebuild des Raids!
    Die Platte war vorher ausgefallen, das Raid aufgelöst und deswegen hatte ja den Rebuild angeworfen. Der wurde aber nach Stunden im Log als immer noch nicht abgeschlossen geführt.
    Aber ich schätze ich werde Dir in kurzer Zeit ein Screenshot des alten Zustandes zeigen können.

    GG 4799

  4. #4
    Registriert seit
    Dec 2014
    Beiträge
    310
    Zitat Zitat von KingofKning Beitrag anzeigen
    Danke für den Hinweis ;-)

    Aber ich mache ja bei so einem Bild keinRebuild des Raids!
    ...
    ... ja aber genau SO hat sich Dein Beitrag angehört (bzw. angelesen..).
    Na gut, somit wohl erledigt.

  5. #5
    Registriert seit
    Jul 2001
    Beiträge
    2.646
    Zitat Zitat von hel400 Beitrag anzeigen
    Das ist übrigens mittlerweile ein bekannter Fehler
    Das ist kein Fehler. Jedes Mal, wenn ein defekter Sektor erkannt und ein Reserve-Sektor verwendet wird (davon gibt es ein paar), gibt es eine SMART-Meldung. Und genau darauf hin weist die Meldung hin. Man sollte zumindest dem Hw-Servicegeber Bescheid geben oder eine Platte bestellen...

    -h
    www.RZKH.de
    IBM Champion 2022, 2023, 2024
    IBM i Community Advocate https://www.youracclaim.com/badges/6...c-7ad4ba147af6
    Common / CEAC
    http://pub400.com

  6. #6
    Registriert seit
    Dec 2014
    Beiträge
    310
    kann hier nur nochmals die Informationen direkt vom IBM Support wiedergeben: Ein (bekannter) Fehler, der zuerst durch versuchsweises Installieren eines PTFs zu beheben ist. Erst wenn dann weiterhindiese Meldungen kommen, wird die Platte getauscht (soll heißen: Natürlich kann di Platte tatsächlich defekt sein - es kann aber auch sein, dass die Fehlermeldung selbst fälschlicherweise kommt ...)

  7. #7
    Registriert seit
    Jul 2001
    Beiträge
    2.646
    Zitat Zitat von hel400 Beitrag anzeigen
    kann hier nur nochmals die Informationen direkt vom IBM Support wiedergeben
    Da hat dann aber jemand wieder eine alte Nummer ausgegraben. Es gab und gibt natürlich immer wieder mal Firmware-Probleme (IBM fummelt ja an jeder Plattenfirmware rum, und kauft auch Platten zu) - da kann es auch schon mal zu Timeouts kommen, die solche Fehlercodes "irrtümlich" raus hauen. Aber das ist der seltene Fall. Der etwas häufigere Fall ist nämlich, daß der Controller bzw. der IBM i - LIC zu blöde ist, die entsprechende S.M.A.R.T.-Meldung der Platte korrekt zu interpretieren. Das fing bei den 6713 aus Quantum-Produktion an, und hatte eine gewisse Tradition bei den 35GB-Platten von Hitachi.

    Häufiger ist es wirklich ein langsames Wegsterben der Platte, das man ernst nehmen sollte. In der Regel fängt es 2-4 Wochen vor dem tatsächlichen Tod der Platte an... Aktuell beobachte ich gerade bei einem Kunden mit 280er SAS-Platten, daß die Meldung täglich kommt seit ca. 10 Wochen. Kunde macht nix. IBM empfiehlt PTFs. Kunde kann nur im Monatstakt IPL fahren. Kunde fragt IBM, ob das jetzt nur ein falscher Fehler ist oder ob wirklich was mit den Platten ist. Aussage: "äh..."

    Also: abseits der altbekannten Regel, immer mit PTFs aktuell zu sein: Wenn FFFx von einer Platte kommt, schon mal eine neue bereit legen oder vorsorglich tauschen lassen.

    -h
    www.RZKH.de
    IBM Champion 2022, 2023, 2024
    IBM i Community Advocate https://www.youracclaim.com/badges/6...c-7ad4ba147af6
    Common / CEAC
    http://pub400.com

  8. #8
    Registriert seit
    Dec 2014
    Beiträge
    310
    Zitat Zitat von holgerscherer Beitrag anzeigen
    ...
    ...
    Aktuell beobachte ich gerade bei einem Kunden mit 280er SAS-Platten, daß die Meldung täglich kommt seit ca. 10 Wochen. Kunde macht nix.
    IBM empfiehlt PTFs.

    ...
    ...

    Also: abseits der altbekannten Regel, immer mit PTFs aktuell zu sein: Wenn FFFx von einer Platte kommt, schon mal eine neue bereit legen oder vorsorglich tauschen lassen.

    -h
    Ich stelle also fest, dass wir (wieder mal) im Grunde einer Meinung sind :-)

    Und - wie gesagt (siehe letzter Satz in Beitrag #2) bin ich in so einem Fall auch vorsichtshalber für das rasche Tauschen der Platte.

  9. #9
    Registriert seit
    Nov 2003
    Beiträge
    2.307
    Interessant ist in solchen Fällen immer die Frage, wen's wie hart trifft, wenn etwas passiert.

    Zitat Zitat von holgerscherer Beitrag anzeigen
    Aktuell beobachte ich gerade bei einem Kunden mit 280er SAS-Platten, daß die Meldung täglich kommt seit ca. 10 Wochen. Kunde macht nix. IBM empfiehlt PTFs. Kunde kann nur im Monatstakt IPL fahren. Kunde fragt IBM, ob das jetzt nur ein falscher Fehler ist oder ob wirklich was mit den Platten ist. Aussage: "äh..."

  10. #10
    Registriert seit
    Jul 2001
    Beiträge
    2.646
    Zitat Zitat von Pikachu Beitrag anzeigen
    Interessant ist in solchen Fällen immer die Frage, wen's wie hart trifft, wenn etwas passiert.
    Kommt drauf an, welche Fallhöhe man aushält. In konkretem Fall hat der Kunde zum Glück ein Spiegelsystem

    -h
    www.RZKH.de
    IBM Champion 2022, 2023, 2024
    IBM i Community Advocate https://www.youracclaim.com/badges/6...c-7ad4ba147af6
    Common / CEAC
    http://pub400.com

Berechtigungen

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • You may not post attachments
  • You may not edit your posts
  •