insert mit values macht immer table scan [Archiv]

View Full Version : insert mit values macht immer table scan

Seiten : [1] 2 3

franz77

18-12-18, 23:44

Hallo!

Ich habe ein Problem mit SQL. Embedded in RPQ oder im Acces Client ausgeführt ist egal.

Ich habe eine simple Tabelle mit ca 10 Feldern. Hauptsächlich Integer und ein varchar.
Die Tabelle hat einen Primary key (integer) und ca 12000 Einträge.

Wenn ich ein Visual Explain von einem insert mache, das etwa so aussieht:
insert into tbzb (id, f1, f2, f3,...) values (....) macht das Statement immer einen Table-Scan und liest alle 12000 Einträge.

Als Begründung steht im Explain, dass er keinen Index findet. Ich habe aber schon alle möglichen Indices in alken möglichen Varianten probiert. Advisen tut er auch nix.

Ich komm hier irgendwie nicht weiter. Das Insert dauer jetzt schon bei der ersten Ausführung in einem Job ca 300ms.

Wie kann ich den Table-Scan vermeiden und nicht alle Records lesen?

BG

Fuerchau

19-12-18, 00:20

Also ein Insert macht keinen Tablescan.
Aber was gibst du bei den Values an?
Hast du da ggf. einen Subselect oder einen Funktionsaufruf dabei?
Poste mal den gannzen SQL.

franz77

19-12-18, 08:05

Hier das Insert und darunter die Tabelle. Ich habe Screenshots angehängt mit dem Visual Explain

In Diesem Fall hat die Tabelle gut 2000 Einträge

INSERT INTO testlib3.tbzt(ztdatum) values('2028-12-22');

CREATE TABLE TESTLIB3.TBZT (
ZTDATUM DATE NOT NULL ,
ZTJAHR INTEGER DEFAULT NULL ,
ZTMONAT INTEGER DEFAULT NULL ,
ZTTAG INTEGER DEFAULT NULL ,
ZTWOCHENTAG FOR COLUMN ZTWT INTEGER DEFAULT NULL ,
ZTWOCHE INTEGER DEFAULT NULL ,
ZTTAGJAHR INTEGER DEFAULT NULL ,
ZTQUARTAL INTEGER DEFAULT NULL ,
ZTPERIODEWOCHE FOR COLUMN ZTPERW VARCHAR(8) CCSID 1141 DEFAULT NULL ,
ZTPERIODE VARCHAR(7) CCSID 1141 DEFAULT NULL ,
ZTGEJAHR INTEGER DEFAULT NULL ,
ZTGEQUARTAL FOR COLUMN ZTGEQUAR INTEGER DEFAULT NULL ,
ZTGEQUARTALVOLL FOR COLUMN ZTGEQUARV VARCHAR(8) CCSID 1141 DEFAULT NULL ,
CONSTRAINT TESTLIB3.PK_ZT PRIMARY KEY( ZTDATUM ) )

RCDFMT TBZT ;

Fuerchau

19-12-18, 09:33

Nun, da nehme ich mal an, dass der Visual Explain ja von einem Select/Update ausgeht und keine Where-Klausel findet, von einem Tablescan ausgehen muss.

Ein Insert schreibt aber einfach in die Tabelle und prüft allenfalls noch Constraints, wie in deinem Fall den Primary key.
Wie kommst du nun auf die Insert-Zeit von 300ms?

Du musst da folgendes beachten:
Ein Insert muss implizit noch ein Open machen.
Beim 1. Insert folgt ebenso auch ein Close.
Erst ab der 2. Wiederholung wird der ODP (Open Data Path) nicht mehr geschlossen, so dass alle folgenen Inserts erheblich schneller sind.

Prüfe also mal, ob dein Insert-Test nicht noch von wesentlichen anderen Faktoren abhängt:
Ggf. FileHandler-Programm mit ACTGRP(*NEW) statt ACTGRP(*CALLER)?

Die reine Insertzeit dürfte kaum 1 ms übersteigen.

franz77

19-12-18, 09:44

Genau das ist der Effekt den ich habe un der mich etwas verunsichert/stört.

Das erste insert in einem Job dauer immer so 300ms, alle weiteren Inserts gehen dann extrem schnell.
Das mit dem open, Close und dem ODP hab ich schon so reproduziert (DM Monitor)

Die FileHandler Thematik kann ich ausschliessen.
Ich habe beim Programm ACTGRP(*NEW). Aber wenn ich nach dem ersten insert aus dem PGM rausgehe und dann wieder rein,dann ist das insert schnell. Es ist immer nur das erste insert nach dem Starten des Terminal-Jobs.

Nun kommen mit 300ms auf einem System auf dem zum Testzeitpunk nur ich angemeldet bin schon extrem lange vor. Ist das normal bzw. muss man mit dem einfach rechnen, beim ersten insert?
Wäre nativio (chain, write) da wesentlich schneller?

Fuerchau

19-12-18, 11:40

Nein, das ist da auch nicht (wesentlich) schneller.
Der Open/Close muss ja immer gemacht werden.
Des weiteren ruft SQL eben immer den Optimizer auf um einen Zugriffspfad des impliziten Selects "values(...)" zu ermitteln.
Und das kann schon mal dauern. Zumal dann, wenn der Insert nicht mit Hostvariablen sondern als dynamischer SQL mit eingebetten Werten arbeitet.
In diesem Fall ist jedes mal ein Syntaxcheck erforderlich.
Dabei werden sämtliche eingebetteten Inhalt von SQL in temporäre Hostvariablen ausgelagert und mit "?" ersetzt. Danach erfolgt die Analyse, wobei nun die Erkennung zuschlagen kann, dass dieser SQL schon analysiert ist.
Deshalb sollten auch bei dynamischen SQL Hostvariablen oder eine SQLDA verwendet werden um performant zu arbeiten.

Zu sehen ist das wie beim Autofahren. Bis das Auto mal auf 100 ist, dauert es halt je nach Leistung unterschiedlich lange. Und wenn dann ein Stau kommt, hast du das immer wieder.

Pikachu

19-12-18, 11:48

Tritt das Problem auch bei Feldern mit anderen Datentypen auf?

Fuerchau

19-12-18, 13:50

Seit wann ist Open/Close inhaltsabhängig;-)?

franz77

20-12-18, 17:49

Ich habe das gestern und heute mit dem IBM Support diskutiert mit folgender Conclusio.

Beim Insert wird tatsächlich sowas ähnliches wie ein Tables-Scan gemacht. Das Visual-Explain zeigt dann halt Table-Scan an.

Die 300ms sind nicht extrem ungewöhnlich, beim ersten Ausführen. Das Problem ist dem IBM Support schon öfter mal untergekommen und wurde auch zutodeanalysiert.

Mit dem Outcome, dass es vorallem auf Systemen auftritt, die sich den ganzen Tag langweilen.

Wir haben sehr viel debuggt und auffällig ist schon, dass das insert mit strsql wesentlich schneller geht als über embedded sql (2x). Wirklichen Grund haben wir dafür aber nicht gefunden. Mein Sourcecode ist supersimpel.

Was interessant is ist, dass das Einfügen in die selbe Tabelle mit Native - IO (RPG Write) beim ersten Mal immer unter 20ms dauert, also über 10x mal so schnell ist. Meistens sogar unter 10ms, also 30x so schnell.

Deckt sich das mit euren Erfahrungen?

andreaspr@aon.at

21-12-18, 08:43

Könnte durchaus sein, dass mit Native IO es etwas schneller geht.
Das mit dem Testen ist jedoch so eine Sache ...
Hast du den Native IO Test direkt nach dem SQL Test gemacht?
Wenn die Tabelle einmal im RAM ist geht's grundsätzlich schon mal schneller und das ist auch das Problem bei Systemen die sich Langweilen, im Gegensatz zu System die aktiv sind.
Dort sind Tabellen bzw. Objekte die öfters verwendet werden auch im RAM und dadurch schneller zugreifbar.
Dann wäre auch noch die Frage wie die Zeitmessung bei Native IO ausgesehen hat? Vor dem Programm start oder im Programm? Wenn im Programm, hast du mit USROPN gearbeitet und den Startzeitpunkt vor dem OPEN gesetzt usw.

lg Andreas