Anmelden

View Full Version : Anzahl aktive Jobs wächst ständig - was tun?



m_OO_m
07-08-11, 18:13
Hallo zusammen,

bin kein AS400-Mensch, wir haben auch niemanden, der sich wirklich damit auskennt - muss daher hier um Hilfe bitten.

Folgende Symptome: WRKSYSSTS gibt eine Anzahl von 9100+ Jobs zurück, Tendenz steigend mit ca. 50/St. WRKACTJOB dagegen zeigt nur 550+ Jobs an. Der Rest müsste m.E. also zu "All jobs that have completed running but still have output on output queues to be produced." gehören.

Es gibt noch massenhaft folgende Meldungen in QSYSOPR:

Überlauf der Jobnachrichtenwarteschlange für 103373/ADS/F01PKU erlaubt. und
Jobprotokoll wegen CPF4167 nicht an Ausgabewarteschlange geschrieben.Zum letzteren heisst es:
Technische Beschreibung . . . . . . . : Während des Öffnens der Druckdatei
QPJOBLOG oder während der Generierung des Jobprotokolls empfing QMHJLOG eine
Ausnahmebedingung CPF4167. Abhängig vom Zeitpunkt, zu dem der Fehler
auftrat, wurde das Jobprotokoll nicht oder nur teilweise generiert.

Ich vermute also, dass hier mit dem Logging irgendwas nicht stimmt, wodurch die Jobs nicht beendet werden.

Was soll ich tun?

KingofKning
07-08-11, 19:19
Am besten holst Du dir jemanden der sich mit der Kiste auskennt. Die Kiste ist zwar pflegleicht, aber nur dann wenn man weis an welcher Schraube man drehen muß.

Aber zu Deinem Problem, das die Anzahl der Jobs steigt ist nicht wirklich dramatisch.
Wenn Du dir mal einen Job mit wrkactjob und dann mit 5 und dann mit 4 die Spooldatei ansiehst, siehst Du in welcher Outqueue die Protokolle stehen. In der Outq sollst Du dann die Logs löschen, dann verschwinden auch die Jobs.
Mach mal ein go cleanup und sschau mal nach ob der Job regelmäßig läuft.
BTW. Wenn Du mal mit der CPF Meldung googelst siehst Du das da wirklich Handlungsbedarf besteht bei dem JoB

GG

m_OO_m
07-08-11, 20:45
Danke, das werde ich tun. Hauptsache das Ding hält bis morgen durch ;)

DKSPROFI
07-08-11, 21:27
Moin,

es ist eigentlich sehr ungewöhnlich, dass der Job 103373/ADS/F01PKU (Kontenübernahme) einen Überlauf der Nachrichtenwarteschlange verursacht. Wieviel Konten übernimmst du denn so?
Loopt vieleicht der Job?

mfg

Michael

Pikachu
08-08-11, 00:09
Mit DSPJOBTBL kannst du nachsehen, wie die Jobs von Status her verteilt sind und wie sich das weiter entwickelt.

Ein Überlauf der Nachrichtenwarteschlange deutet darauf hin, daß ein Job laufend Nachrichten protokolliert. Sieh mal mit WRKJOB 103373/ADS/F01PKU, dann mit Auswahl 5=Arbeiten mit, dann Auswahl 10=Jobprotokoll, dann F10=Detailnachrichten und F18=Ende bei diesem Job nach, was der da alles protokolliert.

CPF4167 beim Versuch, das Jobprotokoll zu schreiben, bedeutet, daß ein Job sein Jobprotokoll nicht als Spooldatei schreiben kann, weil die maximale Anzahl Spooldateien, die er erstellen kann, bereits erreicht ist. Siehe auch mit DSPMSGD CPF4167.

Halte mal den Job F01PKU im WRKACTJOB mit Auswahl 3=Anhalten an. Treten danach die genannten Symptome immer noch auf? Du kannst diesen Job im WRKACTJOB wieder mit Auswahl 6=Freigeben, wenn er weiterlaufen soll.

GeorgG
08-08-11, 07:27
Guten Morgen

das sieht eher so aus als wäre die maximale Anzahl Spooldateien erreicht. Schau mal in dem Systemwert QMAXSPLF, wenn dieser Wert auf 9999 sitzt solltest du ihn erhöhen. Desweiteren schau dir mal die Joblogs, welche auf Pending stehen an mit dem Command WRKJOBLOG *PENDING, diese kannst du in der Regel löschen. Der Systemwert für die Jobprotokollierung, QLOGOUTPUT, steht sehr wahrscheinlich auf *PND, diesen solltest du auf *JOBEND ändern.
Es wurde wahrscheinlich nach einem Releaswechsel die Systemwerte nicht geprüft.

BenderD
08-08-11, 07:53
Guten Morgen

das sieht eher so aus als wäre die maximale Anzahl Spooldateien erreicht. Schau mal in dem Systemwert QMAXSPLF, wenn dieser Wert auf 9999 sitzt solltest du ihn erhöhen. Desweiteren schau dir mal die Joblogs, welche auf Pending stehen an mit dem Command WRKJOBLOG *PENDING, diese kannst du in der Regel löschen. Der Systemwert für die Jobprotokollierung, QLOGOUTPUT, steht sehr wahrscheinlich auf *PND, diesen solltest du auf *JOBEND ändern.
Es wurde wahrscheinlich nach einem Releaswechsel die Systemwerte nicht geprüft.

... naja, das würde ich nicht ungeprüft übernehmen. QMAXSPLF bezieht sich auf einen Job und da ist 9999 Spoolfiles schon verdächtig. Die vorher bereits gepostete Hypothese, dass der angeführte Batchjob krank ist, würde ich zuerst untersuchen, bevor man da an einer falschen Schraube was schlimmbessert und ein kranker Job die Platten bis zum Stillstand des Systems zumüllt.

D*B