Anmelden

View Full Version : Tägliche Überprüfung wichtiger Systemfunktionen



Seiten : 1 [2]

detfall
15-12-10, 18:45
Hallo Herbert,

danke für den Hinweis. Die Überwachungen im Navi habe ich auch schon entdeckt und ein bißchen damit experimentiert. Im einem amerikanischen Forum habe ich allerdings gelesen, dass mit dem Befehl STRWCH das Gleiche erreicht wird, aber mit deutlich besserer Performance.

Der Nachteil ist halt, dass man sein Exit-Programm beim STRWCH selber schreiben muss.

Hat schon jemand mal STRWCH eingesetzt?

Gruß
Detlef

QSECOFR-1
22-12-10, 10:39
Hi,
ich schaue mir täglich folgende Dinge an:

wrkprb
wrkalr
wrksyssts
dspmsg qsysopr
wrkactjob sbs((sbs1) (sbs2) ...)
=> hier schaue ich in die wichtigen Subsysteme rein ob alles soweit gestartet ist, jobs auf MSGW stehen usw.

Dafür habe ich mir ein simples Makro erstellt welches ich jeden Tag starte.

Darüber hinaus gibt's regelmäßig eine Auswertung über die Plattenbelegung im IFS und über die Tabellen.

Zusätzlich gibt's noch eine paar spezifische Dinge die mehr mit den Anwendungen verbunden sind, die man auf dem System installiert hat.
Denn es ist gut zu wissen was auf dem System so abgeht aber das hängt auch immer damit zusammen wofür man die Maschine einsetzt.
Stichwort Websphere, ContentManagement, OnDemand etc.
Solche Dinge muss man ebenfalls im Blick halten.

Sollte die Maschine husten, muss man auch wissen woher das Husten herkommt und was dagegen unternehmen kann ;-).

MR-BN
17-01-11, 17:53
hallo.
wir haben uns etwas erstellt, welches nach einem festgelegten Intervall (15-60 Minuten) das System auf Fehlermeldungen hin überprüft. WRKACTJOB (MSG), DSPPRB, WRKDSTQ, usw. Damit bekommen wir sofort mit, wenn es irgendwie "hakt".
Wenn etwas vorliegt, bekomme ich eine Mail oder einen entsprechenden Hinweis auf einen Drucker (mit den entsprechenden Informationen)

Jordi Giacomo
17-01-11, 18:42
Welchen praktischen Weg oder Kompomiss nutzt ihr? Bin für jeden Hinweis dankbar.
Gruß
Detfall

Hallo,
ein Problem kann sein, wenn eine automatische Anwendung (FTP, EDI) viel mehr Daten produziert als gewöhnlich. Das kann man feststellen, wenn man sich täglich eine Objektliste macht und die mit der vom Vortag vergleicht und bei einer Abweichung von > x % eine Nachricht schickt oder so. Ich hatte das Problem mal im EDI-Bereich, wenn Packmittelsegmente erstellt wurden und für jeden Artikel eine eigene Palette definiert war.
Gruss
Jordi

detfall
17-01-11, 19:03
Hallo MR-BN,

die Idee mit WRKACTJOB alle paar Minuten in einer Schleife nachzuschauen ob etwas "hakt" halte ich für keine gute Idee. Wenn die Maschine mal wirklich ein Performance-Problem hat, (z.B. >90% CPU Auslastung), dann verschlimmerst Du das Problem durch ein WRKACTJOB noch mehr.

Wenn ich mehr als einige Tausend Jobs im System habe, (ich habe schon Maschinen gesehen mit 130.000 Jobs im System) dann muss jede Ausführung von WRKACTJOB die Job-Control Tabellen lesen, die Performancedaten der aktiven Jobs berechnen, die Anzeige aktualisieren und und... nur um mir die aktuellen Zahlen zu liefern. In diversen Performance Tipps und Redbooks findet man Hinweise, dass man den WRKACTJOB Befehl in solchen Fällen möglichst nicht benutzen soll.

Viel besser wäere es den Befehl WRKSYSACT (gibt es erst ab V6R1 oder nur wenn man das Performance Tool 5722-PT1 installiert hat) zu benutzen. Die Anzeige ist nicht nur präziser, sie kommt auch viel weniger Ressourcen der Maschine aus und zeigt wirklich nur die "aktiven" Jobs an.

Wenn man life etwas überwachen will, ist seit V5R4 der Befehl STRWCH bestens dazu geeignet. Oder im Navigator eine Überwachung einrichten.

Mir ging es bei meiner Frage eher darum, zu erkennen wie ich den "Gesundheitszustand" der Maschine täglich mit einfachen Mitteln überprüfen kann. Ich sitze nicht täglich vor der Maschine und deshalb ist die aktuelle Auslastung auch weniger relevant für mich. Ich muss nur wissen hatte die Maschine heute oder gestern irgendwelche Probleme und wenn ja welche? Dazu durchforste ich inzwischen die Logfiles vom BRMS (Datensicherung o.K?) die History (Benutzerprofile oder Datenstationen abgehängt, Ausnahmebedingungen, Operatoreingriff erforderlich usw.?

Die Hardware kann man kaum besser überprüfen als mit dem IBM Service Agent (GO SERVICE). Er meldet Fehler automatisch an IBM (auch vorbeugend) bevor ich jemals davon gemerkt habe und holt sich im Zweifelsfall die notwendigen PTFs von der IBM. Egal ob die Cache Batterie leer wird oder ob die Platten auszufallen drohen, hiermit wird die Hardware ständig überwacht ohne, dass ich mich darum kümmern muss.

Eine gute Idee ist es auch die Message Queue QSYSMSG einzurichten und ein Überwachungprogramm daran einzurichten. Ich habe das so eingerichtet, dass ich eine E-Mail bekomme sobald eine Nachricht an QSYSMSG gesendet wird. In der Mail kann ich die Nachricht selber erkennen und Maßnahmen ergreifen.

Je mehr ich mich mit der Überwachungsproblematik beschäftigte, je mehr entdecke ich was man noch alles automatisieren könnte.:D

Die Performance überwache ich inzwischen mit dem Performance Monitor. Ich kann zwar mit dem Navigator inzwischen gute Performancegrafiken erstellen, aber ich suche immer noch einen Weg diese Grafiken per CL erstellen zu lassen. Hier konnte mir bisher leider keiner weiter helfen. Ich bin zwar immer noch überzeugt davon, dass dies möglich ist, aber wahrscheinlich muss man ein API oder Java-Programm dafür benutzen.

Ich suche jedenfalls weiter.:confused:

svit
05-07-13, 11:01
hallo Georg,

Sie haben ein Script angeboten.
Besteht die Möglichkeit das Sctipt zu bekommen.
danke

holgerscherer
05-07-13, 21:41
Hallo Manfred,

danke für dein CLP. Wie man das programmiert ist mir schon klar. Ich möchte vor allem wissen: WAS kontrolliert ihr täglich? Und was hat sich auf Grund der Erfahrungen als sinvoll erwiesen es täglich zu kontrollieren.

Ist es z.B. wirklich sinnvoll TÄGLICH den freien Plattenplatz zu kontrollieren, wenn in meinem System 7 Terabytes installiert sind und die gerade mal zu 20% belegt sind?

Alles was sich automatisch überwachen lässt möchte ich automatisieren (z.B. mit STRWCH) damit ich mich auf die wirklichen Ausnahmen konzentrieren kann.

Gruß
Detlef

Hi Detlef,
klar lohnt es, dein Plattenplatz täglich (oder häufiger) zu prüfen. Eine Power7 kann mit einem kleinen Loop recht flott den Plattenplatz voll kriegen.

Denke auch an Jobs, die auf MSGW laufen können, oder Drucker. Oder JobQs, die >2 Jobs drin haben, obwohl da immer nur einer sein sollte.

Denk einfach an das schlimmste - und sei darauf vorbereitet :)

-h

holgerscherer
05-07-13, 21:45
Hallo MR-BN,

die Idee mit WRKACTJOB alle paar Minuten in einer Schleife nachzuschauen ob etwas "hakt" halte ich für keine gute Idee. Wenn die Maschine mal wirklich ein Performance-Problem hat, (z.B. >90% CPU Auslastung), dann verschlimmerst Du das Problem durch ein WRKACTJOB noch mehr.

Wenn ich mehr als einige Tausend Jobs im System habe, (ich habe schon Maschinen gesehen mit 130.000 Jobs im System) dann muss jede Ausführung von WRKACTJOB die Job-Control Tabellen lesen, die Performancedaten der aktiven Jobs berechnen, die Anzeige aktualisieren und und... nur um mir die aktuellen Zahlen zu liefern. In diversen Performance Tipps und Redbooks findet man Hinweise, dass man den WRKACTJOB Befehl in solchen Fällen möglichst nicht benutzen soll.


Dem muss ich wiedersprechen: auf unserer PUB1 [www.rzkh.de] ist teilweise die Hölle los, und wenn man im WRKACTJOB nicht alle Jobs nimmt, sondern nur interaktive und Batchjobs, ist die Performance kein Thema.

Wir sammeln von über 50 Maschinen verschiedene Daten, unter anderem auch via WRKACTJOB; alle 5 Minuten. Performance-Auswirkungen selbst auf einer kleinen 170er unter einem Prozent.

-h

Chris.jan
08-07-13, 08:11
Ich glaube die Daten die man prüfen muss ist von System zu System verschieden. Größter Faktor für Störungen ist meiner Erfahrung nach der Mensch. Meistens hat da irgendein "Power User" mit zuviel Berechtigung ein schrottiges Script angeworfen oder ein Journal vollaufen lassen.
Ich habe zuletzt diverse Reports allesamt in einen Report gelegt, den ich vom PC aus angucken kann:
- Report mit OUTPUT(*PRINT) erstellen
- mit CPYSPLF in eine Datei ausgeben/anhängen
- mit CPY2PCD die Datei als Textdatei in einen Folder schicken, im Name steckt auch das Datum; ggf. sende ich das noch auf einen zentralen Server, von wo ich dann alle LPars kontrollieren kann
Damit bin ich soweit sehr zufrieden, denn dazu muss ich keine zig Befehle mehr eingeben, mich nicht überall einloggen und die Berichte sind zwecks Monitoring dann auch noch später zu Verfügung.

Jetzt muss ich nur noch etwas dieser Art für den VIO machen, ZBsp die Ausgabe von errpt versenden.