Ich habe ein Problem mit SQL. Embedded in RPQ oder im Acces Client ausgeführt ist egal.
Ich habe eine simple Tabelle mit ca 10 Feldern. Hauptsächlich Integer und ein varchar.
Die Tabelle hat einen Primary key (integer) und ca 12000 Einträge.
Wenn ich ein Visual Explain von einem insert mache, das etwa so aussieht:
insert into tbzb (id, f1, f2, f3,...) values (....) macht das Statement immer einen Table-Scan und liest alle 12000 Einträge.
Als Begründung steht im Explain, dass er keinen Index findet. Ich habe aber schon alle möglichen Indices in alken möglichen Varianten probiert. Advisen tut er auch nix.
Ich komm hier irgendwie nicht weiter. Das Insert dauer jetzt schon bei der ersten Ausführung in einem Job ca 300ms.
Wie kann ich den Table-Scan vermeiden und nicht alle Records lesen?
Also ein Insert macht keinen Tablescan.
Aber was gibst du bei den Values an?
Hast du da ggf. einen Subselect oder einen Funktionsaufruf dabei?
Poste mal den gannzen SQL.
Nun, da nehme ich mal an, dass der Visual Explain ja von einem Select/Update ausgeht und keine Where-Klausel findet, von einem Tablescan ausgehen muss.
Ein Insert schreibt aber einfach in die Tabelle und prüft allenfalls noch Constraints, wie in deinem Fall den Primary key.
Wie kommst du nun auf die Insert-Zeit von 300ms?
Du musst da folgendes beachten:
Ein Insert muss implizit noch ein Open machen.
Beim 1. Insert folgt ebenso auch ein Close.
Erst ab der 2. Wiederholung wird der ODP (Open Data Path) nicht mehr geschlossen, so dass alle folgenen Inserts erheblich schneller sind.
Prüfe also mal, ob dein Insert-Test nicht noch von wesentlichen anderen Faktoren abhängt:
Ggf. FileHandler-Programm mit ACTGRP(*NEW) statt ACTGRP(*CALLER)?
Die reine Insertzeit dürfte kaum 1 ms übersteigen.
Genau das ist der Effekt den ich habe un der mich etwas verunsichert/stört.
Das erste insert in einem Job dauer immer so 300ms, alle weiteren Inserts gehen dann extrem schnell.
Das mit dem open, Close und dem ODP hab ich schon so reproduziert (DM Monitor)
Die FileHandler Thematik kann ich ausschliessen.
Ich habe beim Programm ACTGRP(*NEW). Aber wenn ich nach dem ersten insert aus dem PGM rausgehe und dann wieder rein,dann ist das insert schnell. Es ist immer nur das erste insert nach dem Starten des Terminal-Jobs.
Nun kommen mit 300ms auf einem System auf dem zum Testzeitpunk nur ich angemeldet bin schon extrem lange vor. Ist das normal bzw. muss man mit dem einfach rechnen, beim ersten insert?
Wäre nativio (chain, write) da wesentlich schneller?
Nein, das ist da auch nicht (wesentlich) schneller.
Der Open/Close muss ja immer gemacht werden.
Des weiteren ruft SQL eben immer den Optimizer auf um einen Zugriffspfad des impliziten Selects "values(...)" zu ermitteln.
Und das kann schon mal dauern. Zumal dann, wenn der Insert nicht mit Hostvariablen sondern als dynamischer SQL mit eingebetten Werten arbeitet.
In diesem Fall ist jedes mal ein Syntaxcheck erforderlich.
Dabei werden sämtliche eingebetteten Inhalt von SQL in temporäre Hostvariablen ausgelagert und mit "?" ersetzt. Danach erfolgt die Analyse, wobei nun die Erkennung zuschlagen kann, dass dieser SQL schon analysiert ist.
Deshalb sollten auch bei dynamischen SQL Hostvariablen oder eine SQLDA verwendet werden um performant zu arbeiten.
Zu sehen ist das wie beim Autofahren. Bis das Auto mal auf 100 ist, dauert es halt je nach Leistung unterschiedlich lange. Und wenn dann ein Stau kommt, hast du das immer wieder.
Ich habe das gestern und heute mit dem IBM Support diskutiert mit folgender Conclusio.
Beim Insert wird tatsächlich sowas ähnliches wie ein Tables-Scan gemacht. Das Visual-Explain zeigt dann halt Table-Scan an.
Die 300ms sind nicht extrem ungewöhnlich, beim ersten Ausführen. Das Problem ist dem IBM Support schon öfter mal untergekommen und wurde auch zutodeanalysiert.
Mit dem Outcome, dass es vorallem auf Systemen auftritt, die sich den ganzen Tag langweilen.
Wir haben sehr viel debuggt und auffällig ist schon, dass das insert mit strsql wesentlich schneller geht als über embedded sql (2x). Wirklichen Grund haben wir dafür aber nicht gefunden. Mein Sourcecode ist supersimpel.
Was interessant is ist, dass das Einfügen in die selbe Tabelle mit Native - IO (RPG Write) beim ersten Mal immer unter 20ms dauert, also über 10x mal so schnell ist. Meistens sogar unter 10ms, also 30x so schnell.
Könnte durchaus sein, dass mit Native IO es etwas schneller geht.
Das mit dem Testen ist jedoch so eine Sache ...
Hast du den Native IO Test direkt nach dem SQL Test gemacht?
Wenn die Tabelle einmal im RAM ist geht's grundsätzlich schon mal schneller und das ist auch das Problem bei Systemen die sich Langweilen, im Gegensatz zu System die aktiv sind.
Dort sind Tabellen bzw. Objekte die öfters verwendet werden auch im RAM und dadurch schneller zugreifbar.
Dann wäre auch noch die Frage wie die Zeitmessung bei Native IO ausgesehen hat? Vor dem Programm start oder im Programm? Wenn im Programm, hast du mit USROPN gearbeitet und den Startzeitpunkt vor dem OPEN gesetzt usw.
Ich habe das gestern und heute mit dem IBM Support diskutiert mit folgender Conclusio.
Beim Insert wird tatsächlich sowas ähnliches wie ein Tables-Scan gemacht. Das Visual-Explain zeigt dann halt Table-Scan an.
... der IBM Support war auch schon mal besser.
Was da so passiert, lässt sich leicht nachvollziehen:
Als erstes macht man das unter debug und sieht ins Joblog, wo man dann diagnostics der Query engine findet. Dort sieht man, dass - welch Überraschung - der insert erst mal einen open macht; am billigsten ist da ein öffnen nach Eingangsfolge (womit der visuelle Explain schon aus der Kurve fliegt - die Tools waren auch schon mal besser).
Als nächstes macht man ein STRDBMON TYPE(*DETAIL) und lässt erneut rattern. Dann sieht man sich das ganze an (mit SELECT QQTIME, QQSTIM, QQETIM, QQ1000 FROM ...)
da sieht man dann, dass erst mal ein Connect gemacht wird, dann kommt eine Stafette von Einträgen, die auch davon abhängt, was man da genau macht (static SQL, dynamic SQL, prepare once run multiple...). Die Zeit für den insert ist in dem Eintrag für den insert in Anfang Ende Timestamp komplett, inklusive prepare, dargestellt.
300 Millisekunden sind keineswegs in Ordnung, da ist was krumm - ob es sich rentiert danach zu suchen, hängt davon ab, ob es stört. Für elementare DB Operationen sind Zeiten von max. 1 Millisekunde typisch, auf schnellen Maschinen auch deutlich besser, auf schwächlichen Maschinen auch wenige Millisekunden. Auf einer meiner Spielzeugmaschinen waren es hier knapp 6 Millisekunden beim Erstaufruf, knapp 4 bei Folgeaufrufen (caching lässt grüßen)
Rekord Löffel ist für elementare Operationen immer schneller, egal wovon das IBM Marketing gerade träumen macht, ändern könnte man das, indem man den RLA langsamer macht.
Für komplexe Transaktionen hat SQL mehr Möglichkeiten zu cachen und kann seine Nachteile auch überkompensieren; in der Programmierer Performance ist SQL immer schneller, wenn vor dem Bildschirm ein Profi sitzt.
D*B
PS: SETOBJACC reduziert natürlich den verfügbaren Speicher und verdrängt erst mal anderes aus dem Speicher. Das reinpagen größerer Programme (auch der SQL runtime) ist auf einer AS/400 kein Renner (single level storage lässt grüßen). Knapper Hauptspeicher erklärt oft zähe Erstaufrufe.
Bookmarks