View Full Version : DB2 / SQL / String auf gültige Zeichen prüfen
Mach mal $temp als varying und initialisiere es auf ''.
$temp = $temp + 'x' = 5000 Zeichen + 1 = 5001 => Move 5000 da das Zielfeld zu klein ist.
Achte bei deinen Vergleichen auch wirklich auf die Länge und nimm keine 1-Byte Zeichenvariable sondern verwende für alles UCS2.
Aus x'09' wird dann halt x'0009'.
So sieht jetzt die Lösung aus:
//----------------------------------------------------------------------- // XML-String prüfen
//-----------------------------------------------------------------------
dcl-proc XMLConvert;
dcl-pi *N;
$string ucs2(5000);
end-pi;
dcl-s #i int(10);
dcl-s $ch ucs2(1);
dcl-s $temp varchar(5001) inz('');
for #i = 1 to %len(%trim($string));
$ch = %char(%subst($string:#i:1));
if $ch = u'0009'
or $ch = u'000A'
or $ch = u'000D'
or ($ch >= u'0020' and $ch <= u'D7FF')
or ($ch >= u'E000' and $ch <= u'FFFD')
or ($ch >= u'00010000' and $ch <= u'0010FFFF');
$temp = $temp + $ch;
else;
$temp = $temp + ' ';
endif;
endfor;
$string = $temp;
return;
end-proc;
So funktioniert es erst mal.
Vielen Dank für das auf den richtigen Weg bringen! :-)
Ich würde den Parameter ebenso "varying" definieren und die For-Schleife darf nicht mit %trim() arbeiten.
Wenn mal Leerzeichen am Anfang stehen arbeitest du zu kurz.
Außerdem sollten diese ggf. ja nicht entfernt werden (siehe u'0020').
Was soll die Abfrage
or ($ch >= u'00010000' and $ch <= u'0010FFFF');
Du hast doch kein UCS4.
Ich arbeite in der For-Schleife absichtlich mit Trim, da ich eine größere Menge Sätze bearbeite und das ganze spürbar langsamer wird, wenn man die gesamten 5000 Zeichen durchläuft, auch wenn evtl. nur 200 Zeichen belegt sind. So ist es wesentlich schneller und Leerzeichen am Anfang kommen bei mir nicht vor.
Ich habe die Abfrage so gebaut, weil in der Fehlermeldung unter https://www.ibm.com/support/knowledgecenter/SSEPEK_10.0.0/com.ibm.db2z10.doc.codes/src/tpc/n20377.dita alle erlaubten Zeichen angeben sind - diese habe ich so übernommen.
Wenn du die PI-Variable mit Varying definierst, werden dir ja nur so viele Zeichen übergeben, wie die Quelle lang ist. Du arbeitest ja eben keine 5000 Zeichen durch!
Außerdem musst du folgendes beachten:
Der Aufruf kopiert deine Quelle in ein 5K-Feld und füllt mit Leerzeichen auf.
Die %trim() entfernt die Leerzeichen wieder, %Len() gibt dir die Länge, anschließend verwirfst du das Trim-Ergebnis wieder.
Übergibst du also z.B. " A", gibt deine Routine nur das Leerzeichen zurück.
Also:
Definiere PR/PI mit "varying const" und arbeite ohne Trim die Zeichen ab.
Wenn du die PI-Variable mit Varying definierst, werden dir ja nur so viele Zeichen übergeben, wie die Quelle lang ist. Du arbeitest ja eben keine 5000 Zeichen durch!
Außerdem musst du folgendes beachten:
Der Aufruf kopiert deine Quelle in ein 5K-Feld und füllt mit Leerzeichen auf.
Die %trim() entfernt die Leerzeichen wieder, %Len() gibt dir die Länge, anschließend verwirfst du das Trim-Ergebnis wieder.
Übergibst du also z.B. " A", gibt deine Routine nur das Leerzeichen zurück.
Also:
Definiere PR/PI mit "varying const" und arbeite ohne Trim die Zeichen ab.
@1: Nur wenn ein Parameter im Prototyp/Procedure Interface mit VALUE definiert ist, werden Zeichen überbeben.
Sofern der Parameter by Reference übergeben wird (mit Schlüssel-Wort const oder ohne wie in dem Beispiel) wird nur die Adresse des Parameter-Feldes übergeben unabhängig davon, ob es mit fixer oder variabler Länge definiert wurde.
Die Angabe CONST bewirkt lediglich, dass bei abweichender Parameter-Definition ein zusätzliches Feld mit der erwarteten Parameter-Definition (bei UCS2(5000) sind das 10000 Byte und bei VarUCS2(100002) Byte erstellt wird und dann die Adresse dieses Hilfsfeldes an die rufende Prozedur übergeben wird.
Bei Feldern mit variabler Länge sollte man nicht nur CONST, sondern auch OPTIONS(*TRIM) angeben, damit führende und folgende Blanks gleich abgetrimmt werden.
Die Daten-Länge wird in den beiden führenden Bytes hinterlegt und beim Verarbeiten von Feldern mit variabler Länge geprüft.
Birgitta
Const und Value sind quasi gleicharbeitend mit dem Unterschied das Const nicht geändert werden darf.
In beiden Fällen wird ein Variable (bereits im Compiler generiert) vor der Übergabe gefüllt.
Options(*trim) ist ganz nett sollte aber nicht grundsätzlich verwendet werden:
a) zusätzliche Laufzeit (@D*B: ja im Nanobereich)
b) kommt halt auf die Anwendung an
Leerzeichen (vor allem am Anfang) sind schon manchmal erforderlich.
Was die Performance angeht so sollte die Runtime so intelligent sein nur die benötigte Länge zu übertragen und nicht immer mit Leerzeichen auffüllen.
Aber das bleibt auszuprobieren.
Baldur,
Lies doch mal die Dokumentation!
Es gibt sehr wohl einen Unterschied zwischen CONST und VALUE!
Parameter, die mit CONST übergeben wurden dürfen deshalb nicht geändert werden, weil nie sicher ist, ob der übergebene Pointer auf das Original-Feld oder das Duplikat zeigt.
Sofern keine abweichende Parameter-Defintion festgestellt wird, wird der Pointer auf das Original-Feld übergeben.
Bei VALUE wird IMMER eine Kopie des Original-Feldes erzeugt und dieses an die aufgerufene Prozedur übergeben.
Es wird immer die maximale Länge reserviert, das heißt jedoch nicht, dass diese komplett übergeben oder mit Blanks aufgefüllt wird.
Wie gesagt, die Übergabe erfolgt nur bei VALUE und dann die komplette Länge, was sich bei großen Feldern negativ auf die Performance auswirken kann.
Das bedeutet jedoch nicht, dass der reservierte Speicher mit *Blanks aufgefüllt wird.
Bei Feldern mit variabler Länge, wird die Länge aus den führenden Bytes ermittelt, ob und was im Anschluss daran steht ist irrelevant und wird auch in keiner Form initialisiert.
Ob man Options(*TRIM) verwendet oder nicht kommt auf die Anwendung an. In diesem Fall würde ich die Option setzen, aber nicht kategorisch ablehenen.
Birgitta
Ich fasse mal zusammen: :-D
$string ucs2(5000) options(*trim);
Wird schon vom RDP nicht zugelassen:
RNF3379E: OPTONS(*TRIM) ist für den Parameter ungültig.
$string ucs2(5000) options(*trim) const;
Geht zwar, aber der Parameter wird als Konstante übergeben, d.h. ich kann den geänderten Wert nicht zurück geben. Hilft mir also nicht.
$string ucs2(5000) options(*varsize);
Die Länge der Variablen in der Funktion ist bei 5000 - es wird also das gesamte Feld übergeben. Bringt also nix.
$string varchar(5000);
S.o. Länge 5000;
$string varchar(5000) options(*varsize);
Compilerfehler:
RNF7535: Art und Attribut stimmen nicht mit dem Prototyp überein.
Ergo: ich lasse es so, wie es ist, denn so funktioniert es :-)