-
Plattenwunder
Hallo *all,
meine Backup AS/400 meckerte die ganze Zeit das eine Platte defekt sei. Ein Rebuild des Raids hat nicht gebracht. Habe mir den Spaß ein paar Tage angesehen und als die Warnungen über einen Ausfall immer drastischer wurden,
Code:
Nachrichten-ID . . . . : CPP1604 Bewertung . . . . . . : 90
Nachrichtenart . . . . : Information
Sendedatum . . . . . . : 08.04.17 Sendezeit . . . . . . : 22:26:16
Nachricht . . . : *Achtung* Drohender DASD-Fehler. Den Hardwareservicegeber
sofort verständigen.
Ursache . . . . : Interne Messungen an Platteneinheit DD004 zeigen an, dass
bald ein nichtbehebbarer Fehler, der zu Datenverlust führt, auftreten wird.
dachte ich mir kaufste ne neue Platte. Gesagt getan.
Platte kam am Freitag an und ich dachte ok baust du sie am Montag ein.
Das RWE war aber am Samstag so nett unsere 10 KV Leitung für eine Stunde zu unterbrechen und da die AS/400 keinen Notstrom hatte fiel sie auf die Nase.
Nachdem ich die Kiste wieder neugestartet hatte war auf wundersamme Weise das Raid wieder in Ordnung.
Sachen gibts......
Mal schauen wie lange das hält...... Weil kaputt ist ja eigentlich kaputt.
GG 4799
-
Der Screenshot zeigt aber KEINEN Raid-Fehler sondern bedeutet "nur", dass möglicherweise unter Umständen eventuell ... eine Platte bald ausfallen KÖNNTE.
Das Raid selbst hat aber sicher funktioniert (weil alle Platten noch funktionsfähig!)
Das ist übrigens mittlerweile ein bekannter Fehler - dafür gibt's sogar ein PTF ... da die IBM meint, dass die interne Plattenprüfung zu "sensibel" reagiert ...
(habe bis jetzt aber bei jedem Kunden, wo dieser Fehler auftrat, die Platte vorsichtshalber tauschen lassen - was auch anstandslos gemacht wurde - Wartungsvertrag vorausgesetzt.)
-
Danke für den Hinweis ;-)
Aber ich mache ja bei so einem Bild keinRebuild des Raids!
Die Platte war vorher ausgefallen, das Raid aufgelöst und deswegen hatte ja den Rebuild angeworfen. Der wurde aber nach Stunden im Log als immer noch nicht abgeschlossen geführt.
Aber ich schätze ich werde Dir in kurzer Zeit ein Screenshot des alten Zustandes zeigen können.
GG 4799
-
Zitat von KingofKning
Danke für den Hinweis ;-)
Aber ich mache ja bei so einem Bild keinRebuild des Raids!
...
... ja aber genau SO hat sich Dein Beitrag angehört (bzw. angelesen..).
Na gut, somit wohl erledigt.
-
Zitat von hel400
Das ist übrigens mittlerweile ein bekannter Fehler
Das ist kein Fehler. Jedes Mal, wenn ein defekter Sektor erkannt und ein Reserve-Sektor verwendet wird (davon gibt es ein paar), gibt es eine SMART-Meldung. Und genau darauf hin weist die Meldung hin. Man sollte zumindest dem Hw-Servicegeber Bescheid geben oder eine Platte bestellen...
-h
-
kann hier nur nochmals die Informationen direkt vom IBM Support wiedergeben: Ein (bekannter) Fehler, der zuerst durch versuchsweises Installieren eines PTFs zu beheben ist. Erst wenn dann weiterhindiese Meldungen kommen, wird die Platte getauscht (soll heißen: Natürlich kann di Platte tatsächlich defekt sein - es kann aber auch sein, dass die Fehlermeldung selbst fälschlicherweise kommt ...)
-
Zitat von hel400
kann hier nur nochmals die Informationen direkt vom IBM Support wiedergeben
Da hat dann aber jemand wieder eine alte Nummer ausgegraben. Es gab und gibt natürlich immer wieder mal Firmware-Probleme (IBM fummelt ja an jeder Plattenfirmware rum, und kauft auch Platten zu) - da kann es auch schon mal zu Timeouts kommen, die solche Fehlercodes "irrtümlich" raus hauen. Aber das ist der seltene Fall. Der etwas häufigere Fall ist nämlich, daß der Controller bzw. der IBM i - LIC zu blöde ist, die entsprechende S.M.A.R.T.-Meldung der Platte korrekt zu interpretieren. Das fing bei den 6713 aus Quantum-Produktion an, und hatte eine gewisse Tradition bei den 35GB-Platten von Hitachi.
Häufiger ist es wirklich ein langsames Wegsterben der Platte, das man ernst nehmen sollte. In der Regel fängt es 2-4 Wochen vor dem tatsächlichen Tod der Platte an... Aktuell beobachte ich gerade bei einem Kunden mit 280er SAS-Platten, daß die Meldung täglich kommt seit ca. 10 Wochen. Kunde macht nix. IBM empfiehlt PTFs. Kunde kann nur im Monatstakt IPL fahren. Kunde fragt IBM, ob das jetzt nur ein falscher Fehler ist oder ob wirklich was mit den Platten ist. Aussage: "äh..."
Also: abseits der altbekannten Regel, immer mit PTFs aktuell zu sein: Wenn FFFx von einer Platte kommt, schon mal eine neue bereit legen oder vorsorglich tauschen lassen.
-h
-
Zitat von holgerscherer
...
...
Aktuell beobachte ich gerade bei einem Kunden mit 280er SAS-Platten, daß die Meldung täglich kommt seit ca. 10 Wochen. Kunde macht nix.
IBM empfiehlt PTFs.
...
...
Also: abseits der altbekannten Regel, immer mit PTFs aktuell zu sein: Wenn FFFx von einer Platte kommt, schon mal eine neue bereit legen oder vorsorglich tauschen lassen.
-h
Ich stelle also fest, dass wir (wieder mal) im Grunde einer Meinung sind :-)
Und - wie gesagt (siehe letzter Satz in Beitrag #2) bin ich in so einem Fall auch vorsichtshalber für das rasche Tauschen der Platte.
-
Interessant ist in solchen Fällen immer die Frage, wen's wie hart trifft, wenn etwas passiert.
Zitat von holgerscherer
Aktuell beobachte ich gerade bei einem Kunden mit 280er SAS-Platten, daß die Meldung täglich kommt seit ca. 10 Wochen. Kunde macht nix. IBM empfiehlt PTFs. Kunde kann nur im Monatstakt IPL fahren. Kunde fragt IBM, ob das jetzt nur ein falscher Fehler ist oder ob wirklich was mit den Platten ist. Aussage: "äh..."
-
Zitat von Pikachu
Interessant ist in solchen Fällen immer die Frage, wen's wie hart trifft, wenn etwas passiert.
Kommt drauf an, welche Fallhöhe man aushält. In konkretem Fall hat der Kunde zum Glück ein Spiegelsystem
-h
Berechtigungen
- Neue Themen erstellen: Nein
- Themen beantworten: Nein
- You may not post attachments
- You may not edit your posts
-
Foren-Regeln
|
Erweiterte Foren Suche
Google Foren Suche
Forum & Artikel Update eMail
AS/400 / IBM i
Server Expert Gruppen
Unternehmens IT
|
Kategorien online Artikel
- Big Data, Analytics, BI, MIS
- Cloud, Social Media, Devices
- DMS, Archivierung, Druck
- ERP + Add-ons, Business Software
- Hochverfügbarkeit
- Human Resources, Personal
- IBM Announcements
- IT-Karikaturen
- Leitartikel
- Load`n`go
- Messen, Veranstaltungen
- NEWSolutions Dossiers
- Programmierung
- Security
- Software Development + Change Mgmt.
- Solutions & Provider
- Speicher – Storage
- Strategische Berichte
- Systemmanagement
- Tools, Hot-Tips
Auf dem Laufenden bleiben
|
Bookmarks