-
Tägliche Überprüfung wichtiger Systemfunktionen
hallo.
wir haben uns etwas erstellt, welches nach einem festgelegten Intervall (15-60 Minuten) das System auf Fehlermeldungen hin überprüft. WRKACTJOB (MSG), DSPPRB, WRKDSTQ, usw. Damit bekommen wir sofort mit, wenn es irgendwie "hakt".
Wenn etwas vorliegt, bekomme ich eine Mail oder einen entsprechenden Hinweis auf einen Drucker (mit den entsprechenden Informationen)
-
 Zitat von detfall
Welchen praktischen Weg oder Kompomiss nutzt ihr? Bin für jeden Hinweis dankbar.
Gruß
Detfall
Hallo,
ein Problem kann sein, wenn eine automatische Anwendung (FTP, EDI) viel mehr Daten produziert als gewöhnlich. Das kann man feststellen, wenn man sich täglich eine Objektliste macht und die mit der vom Vortag vergleicht und bei einer Abweichung von > x % eine Nachricht schickt oder so. Ich hatte das Problem mal im EDI-Bereich, wenn Packmittelsegmente erstellt wurden und für jeden Artikel eine eigene Palette definiert war.
Gruss
Jordi
-
Hallo MR-BN,
die Idee mit WRKACTJOB alle paar Minuten in einer Schleife nachzuschauen ob etwas "hakt" halte ich für keine gute Idee. Wenn die Maschine mal wirklich ein Performance-Problem hat, (z.B. >90% CPU Auslastung), dann verschlimmerst Du das Problem durch ein WRKACTJOB noch mehr.
Wenn ich mehr als einige Tausend Jobs im System habe, (ich habe schon Maschinen gesehen mit 130.000 Jobs im System) dann muss jede Ausführung von WRKACTJOB die Job-Control Tabellen lesen, die Performancedaten der aktiven Jobs berechnen, die Anzeige aktualisieren und und... nur um mir die aktuellen Zahlen zu liefern. In diversen Performance Tipps und Redbooks findet man Hinweise, dass man den WRKACTJOB Befehl in solchen Fällen möglichst nicht benutzen soll.
Viel besser wäere es den Befehl WRKSYSACT (gibt es erst ab V6R1 oder nur wenn man das Performance Tool 5722-PT1 installiert hat) zu benutzen. Die Anzeige ist nicht nur präziser, sie kommt auch viel weniger Ressourcen der Maschine aus und zeigt wirklich nur die "aktiven" Jobs an.
Wenn man life etwas überwachen will, ist seit V5R4 der Befehl STRWCH bestens dazu geeignet. Oder im Navigator eine Überwachung einrichten.
Mir ging es bei meiner Frage eher darum, zu erkennen wie ich den "Gesundheitszustand" der Maschine täglich mit einfachen Mitteln überprüfen kann. Ich sitze nicht täglich vor der Maschine und deshalb ist die aktuelle Auslastung auch weniger relevant für mich. Ich muss nur wissen hatte die Maschine heute oder gestern irgendwelche Probleme und wenn ja welche? Dazu durchforste ich inzwischen die Logfiles vom BRMS (Datensicherung o.K?) die History (Benutzerprofile oder Datenstationen abgehängt, Ausnahmebedingungen, Operatoreingriff erforderlich usw.?
Die Hardware kann man kaum besser überprüfen als mit dem IBM Service Agent (GO SERVICE). Er meldet Fehler automatisch an IBM (auch vorbeugend) bevor ich jemals davon gemerkt habe und holt sich im Zweifelsfall die notwendigen PTFs von der IBM. Egal ob die Cache Batterie leer wird oder ob die Platten auszufallen drohen, hiermit wird die Hardware ständig überwacht ohne, dass ich mich darum kümmern muss.
Eine gute Idee ist es auch die Message Queue QSYSMSG einzurichten und ein Überwachungprogramm daran einzurichten. Ich habe das so eingerichtet, dass ich eine E-Mail bekomme sobald eine Nachricht an QSYSMSG gesendet wird. In der Mail kann ich die Nachricht selber erkennen und Maßnahmen ergreifen.
Je mehr ich mich mit der Überwachungsproblematik beschäftigte, je mehr entdecke ich was man noch alles automatisieren könnte.
Die Performance überwache ich inzwischen mit dem Performance Monitor. Ich kann zwar mit dem Navigator inzwischen gute Performancegrafiken erstellen, aber ich suche immer noch einen Weg diese Grafiken per CL erstellen zu lassen. Hier konnte mir bisher leider keiner weiter helfen. Ich bin zwar immer noch überzeugt davon, dass dies möglich ist, aber wahrscheinlich muss man ein API oder Java-Programm dafür benutzen.
Ich suche jedenfalls weiter.
-
hallo Georg,
Sie haben ein Script angeboten.
Besteht die Möglichkeit das Sctipt zu bekommen.
danke
-
 Zitat von detfall
Hallo Manfred,
danke für dein CLP. Wie man das programmiert ist mir schon klar. Ich möchte vor allem wissen: WAS kontrolliert ihr täglich? Und was hat sich auf Grund der Erfahrungen als sinvoll erwiesen es täglich zu kontrollieren.
Ist es z.B. wirklich sinnvoll TÄGLICH den freien Plattenplatz zu kontrollieren, wenn in meinem System 7 Terabytes installiert sind und die gerade mal zu 20% belegt sind?
Alles was sich automatisch überwachen lässt möchte ich automatisieren (z.B. mit STRWCH) damit ich mich auf die wirklichen Ausnahmen konzentrieren kann.
Gruß
Detlef
Hi Detlef,
klar lohnt es, dein Plattenplatz täglich (oder häufiger) zu prüfen. Eine Power7 kann mit einem kleinen Loop recht flott den Plattenplatz voll kriegen.
Denke auch an Jobs, die auf MSGW laufen können, oder Drucker. Oder JobQs, die >2 Jobs drin haben, obwohl da immer nur einer sein sollte.
Denk einfach an das schlimmste - und sei darauf vorbereitet 
-h
-
 Zitat von detfall
Hallo MR-BN,
die Idee mit WRKACTJOB alle paar Minuten in einer Schleife nachzuschauen ob etwas "hakt" halte ich für keine gute Idee. Wenn die Maschine mal wirklich ein Performance-Problem hat, (z.B. >90% CPU Auslastung), dann verschlimmerst Du das Problem durch ein WRKACTJOB noch mehr.
Wenn ich mehr als einige Tausend Jobs im System habe, (ich habe schon Maschinen gesehen mit 130.000 Jobs im System) dann muss jede Ausführung von WRKACTJOB die Job-Control Tabellen lesen, die Performancedaten der aktiven Jobs berechnen, die Anzeige aktualisieren und und... nur um mir die aktuellen Zahlen zu liefern. In diversen Performance Tipps und Redbooks findet man Hinweise, dass man den WRKACTJOB Befehl in solchen Fällen möglichst nicht benutzen soll.
Dem muss ich wiedersprechen: auf unserer PUB1 [www.rzkh.de] ist teilweise die Hölle los, und wenn man im WRKACTJOB nicht alle Jobs nimmt, sondern nur interaktive und Batchjobs, ist die Performance kein Thema.
Wir sammeln von über 50 Maschinen verschiedene Daten, unter anderem auch via WRKACTJOB; alle 5 Minuten. Performance-Auswirkungen selbst auf einer kleinen 170er unter einem Prozent.
-h
-
Ich glaube die Daten die man prüfen muss ist von System zu System verschieden. Größter Faktor für Störungen ist meiner Erfahrung nach der Mensch. Meistens hat da irgendein "Power User" mit zuviel Berechtigung ein schrottiges Script angeworfen oder ein Journal vollaufen lassen.
Ich habe zuletzt diverse Reports allesamt in einen Report gelegt, den ich vom PC aus angucken kann:
- Report mit OUTPUT(*PRINT) erstellen
- mit CPYSPLF in eine Datei ausgeben/anhängen
- mit CPY2PCD die Datei als Textdatei in einen Folder schicken, im Name steckt auch das Datum; ggf. sende ich das noch auf einen zentralen Server, von wo ich dann alle LPars kontrollieren kann
Damit bin ich soweit sehr zufrieden, denn dazu muss ich keine zig Befehle mehr eingeben, mich nicht überall einloggen und die Berichte sind zwecks Monitoring dann auch noch später zu Verfügung.
Jetzt muss ich nur noch etwas dieser Art für den VIO machen, ZBsp die Ausgabe von errpt versenden.
Similar Threads
-
By atwyl in forum IBM i Hauptforum
Antworten: 23
Letzter Beitrag: 29-12-05, 14:31
-
By theyeti in forum IBM i Hauptforum
Antworten: 6
Letzter Beitrag: 22-09-05, 15:12
-
By kab in forum IBM i Hauptforum
Antworten: 9
Letzter Beitrag: 18-09-01, 08:42
Berechtigungen
- Neue Themen erstellen: Nein
- Themen beantworten: Nein
- You may not post attachments
- You may not edit your posts
-
Foren-Regeln
|
Erweiterte Foren Suche
Google Foren Suche
Forum & Artikel Update eMail
AS/400 / IBM i
Server Expert Gruppen
Unternehmens IT
|
Kategorien online Artikel
- Big Data, Analytics, BI, MIS
- Cloud, Social Media, Devices
- DMS, Archivierung, Druck
- ERP + Add-ons, Business Software
- Hochverfügbarkeit
- Human Resources, Personal
- IBM Announcements
- IT-Karikaturen
- Leitartikel
- Load`n`go
- Messen, Veranstaltungen
- NEWSolutions Dossiers
- Programmierung
- Security
- Software Development + Change Mgmt.
- Solutions & Provider
- Speicher – Storage
- Strategische Berichte
- Systemmanagement
- Tools, Hot-Tips
Auf dem Laufenden bleiben
|
Bookmarks