PDA

View Full Version : IPL und Raid



Seiten : [1] 2

KingofKning
22-07-16, 19:14
Hallo *all,
ich habe heute mal wieder mein halbjährliche Komplettsicherung gemacht, und bei dem anschließenden IPL ist mir aufgefallen das eine Platte besonders aktiv war. Ich vermute ja mal die IPL Einheit.
Ich hätte aber beim Raid erwartet das alle 4 Platten des Raids aktiv sind da ja normalerweise die Daten über alle Platten verteilt sind. Andersrum wenn die IPl Source ausfällt kommt die Kiste doch trotzdem hoch.
Was hat es damit auf sich?

GG 5062

hel400
23-07-16, 06:18
Man möge mich bitte korrigieren, ich denke aber, dass es so ist:
Gebootet wird von der "Load Source" Platte, daher die von Dir beobachtete Aktivität.
Ist diese beschädigt, werden die Daten durch Raid 5/6 "errechnet" und das IPL funktioniert daher auch dann.
(alles andere ist duech Raid 0 auf mehrere Platten verteilt, sodass die Aktivitäten im laufenden Betrieb halbwegs ausbalanziert sind)

holgerscherer
27-07-16, 01:30
Gebootet wird von der "Load Source" Platte, daher die von Dir beobachtete Aktivität.

Die Formulierungsfeinheit ist - auf der LoadSource (erste Platte, egal ob mit oder ohne RAID5) liegen diverse interne Daten vom LIC, ebenso werden die Flightrecorder-Daten dorthin geschrieben. Wenn das RAID5 funktional ist, dann erfolgen die Schreibzugriffe (ohne WriteCache) auf diese physikalische erste Platte, wenn dem RAID5 eine Platte fehlt, wird verteilt.

Wozu das gut ist, sieht man bei im SST unter ProductActivityLog / ServiceActionLog. Die Daten sind bevorzugt auf dieser IPL-Platteneinheit, da IBM das wohl im Extremfall immer auslesen kann, wenn das RAID5 ganz tot ist.

-h

KingofKning
30-07-16, 08:57
Tja, wäre mal interessant zu wissen wie der Aufbau des Raids wirklich ist. Es stellt sich für mich ja so dar das z.B. 1 GB auf der Platte alle notwendigen Daten hat ohne das Raid zu bemühen und die selben Daten ja nochmals über das Raid verteilt sind um beim Ausfall der LoadSource trotzdem starten zu können.

Wenn in 50 oder 100 Jahren das OS/400 mal Open Source wird können wir ja nachsehen ;-)

GG 5054

Fuerchau
30-07-16, 10:39
Ist doch eigentlich leicht verständlich:
https://de.wikipedia.org/wiki/RAID#RAID.C2.A05:_Leistung_.2B_Parit.C3.A4t.2C_Blo ck-Level_Striping_mit_verteilter_Parit.C3.A4tsinforma tion
Die einzige Ausnahme werden wohl die Daten sein, die für IPL erforderlich sind.
Da bei RAID5 ja mindestens 2 Platten ausfallen müssen, dürfte das selbst für den IPL noch ausreichen.
Und zur Not hilft dann ja noch IPL von Band/DVD für die Raid-Wiederherstellung.
Aber auch bei RAID kommt man um eine Datensicherung wohl nicht herum.

Bei meinem alten Desktop hatte ich auch mal RAID1. Es hatte allerdings eine Weile gebraucht (mehrere Monate), bis Windows den Ausfall des RAID-Controllers bemerkte bzw. meldete, da die Platten schon länger wieder im Normalbetrieb liefen. Ich konnte allerdings nur 1 Platte, wie vorher auch, sehen.

Bei der AS/400 kommt sowas eigentlich nie vor, da hier die Überwachung stärker ist.

hel400
30-07-16, 11:16
Tja, wäre mal interessant zu wissen wie der Aufbau des Raids wirklich ist. Es stellt sich für mich ja so dar das z.B. 1 GB auf der Platte alle notwendigen Daten hat ohne das Raid zu bemühen und die selben Daten ja nochmals über das Raid verteilt sind um beim Ausfall der LoadSource trotzdem starten zu können

Ich denke, dass Du bei Diesen Gedanken wohl Raid 0 und Raid 5 vermischst(?)
Die AS/400 hat immer(!) Raid 0 (Datenverteilung auf mehrere Platten), zusätzlich KANN man dann noch als Ausfallschutz auf Raid 1 (Spiegeln) oder Raid5 bzw. 6 (Prüfsummenschutz) erhöhen.

Die Daten, die zum Booten benötigt werden, befinden sich nur(!) auf der Load Source, sind also NICHT auf mehrere Platten verteilt, Raid 0 daher keine Auswirkung.
Sehr wohl sind diese Daten aber durch Raid5/6 geschützt (deshalb aber nicht "nochmals" vorhanden, wie von Dir vermutet), indem die Prüfsummen für das Raid-Set mitgeführt werden.

KingofKning
01-08-16, 02:21
Das denke ich nicht, wenn du das system neu installierst, siehst du das eine Platte wesentlich mehr Daten enthält als die anderen das heißt raid0 scheidet aus.

Gg 5045

hel400
01-08-16, 06:43
Ja genau das habe ich ja geschrieben :-)

--> "...Die Daten, die zum Booten benötigt werden, befinden sich nur(!) auf der Load Source, sind also NICHT auf mehrere Platten verteilt, Raid 0 daher keine Auswirkung."

holgerscherer
01-08-16, 09:12
Ja genau das habe ich ja geschrieben :-)

--> "...Die Daten, die zum Booten benötigt werden, befinden sich nur(!) auf der Load Source, sind also NICHT auf mehrere Platten verteilt, Raid 0 daher keine Auswirkung."

Damit Ihr Euch am Wochenanfang nicht gleich verrennt:

- RAID0 hat überhaupt keine Schutzwirkung. Das R ("redundant") ist hier eigentlich fehl am Platze. Es bedeutet nur, dass die Plattenplatz zu einer großen zusammen gefasst werden. Das ist im Prinzip das, was die IBM i mit dem SingleLevel-Storage u.a. macht - alle Platten zusammen fassen. Allerdings immer das, was der Controller netto meldet.
- RAID5/6 (mit/ohne Hotspare) verteilen die Daten nach verschiedenster Logik auf den Platten. Manche Controller haben eigene Logik, so dass sie nicht untereinander austauschbar sind. 274x -> 277x geht, 277x->2740 geht z.B. nicht

nun die IBM i Besonderheit mit der LoadSource (nicht zu verwechseln mit der ersten Platte, die das OS vom Controller gemeldet bekommt):

- Ohne RAID-Controller (also mit RAID 0 oder RAID1 Spiegelung) enthält die LS neben dem LIC (komplett) auch noch Daten des FlightRecorders (Service Action Log, Product Activity Log, Temporäre Tabellen etc). Bei RAID1 ist das alles gespiegelt. Bei RAID5 ist das alles verteilt.
- Warum die erste (physikalische) Platte beim IPL am Dauerleuchten ist trotz RAID5 - beim IPL wird nicht nur gelesen, sondern auch geschrieben. Das wird in den IPL-Schritten des LIC bis zum Ende der ersten 16 IPL-Schritte (wenn an der Konsole eine Anzeige läuft) nur von der LS geladen und dort auch physikalisch mitprotokolliert. Die ausgleichenden Schreibzugriffe erfolgen - warum auch immer - erst später beim RAID5.
- Daher kann auch bei einem ausgefallenen RAID1/5 das System hoch fahren. Wer mag, kann das ja mal simulieren und wird dann feststellen, dass beim RAID5 während des IPL die Plattenzugriffe auf die restlichen Platten verteilt sind. Warum das im Detail so gemacht wurde, habe ich nicht abschliessend klären können - dazu müsste man mal mit einem Tracer den iSCSI-Traffic eine VIOS in Ruhe anschauen. Wenn man die Ruhe hat...

Aus all den Gründen wird verständlich, warum man gerne bei mittleren bis großen Systemen die Plattenkonfig so aufbaut:
- LoadSource ein eigenes Spiegelpärchen, am besten auf zwei SSDs ;-)
- Rest RAID5 oder auch RAID1 oder RAID50 (Spiegelung über Gehäuse oder VIOS)

So, jetzt genug technischen Kram aus dem Hirn geworfen, es ist Montag - ran an die Arbeit...

-h

petterr
01-08-16, 09:32
Die IBM i hat überhaupt kein Raid 0 und auch die Beschreibung des Raid 5 in der Wikipedia trifft auf die IBM i nicht zu 100% zu. Bei einem Raid5 in der PC Server Welt erscheint ein Raid 5 Verbund dem Betriebssystem als 1 großes logisches Laufwerk. Der Raid Controller auf einer Maschine mit IBM i macht dies jedoch nicht so und die Platten werden immer verringert um den Platz für die Paritätsinformation dem Betriebssystem durchgereicht. Das Betriebssystem entscheidet dann aufgrund einer Vielzahl von Parametern auf welcher Platte eine Schreiboperation durchgeführt wird. Der Raidcontroller übernimt dann wieder die Berechnung der Paritätsinformationen. Deshalb ist es auch möglich, dass der gesamte LIC auf der Load Source liegt. Bei einem PC basierten Server wäre so etwas nicht möglich. Die Besonderheit der IBM i ist auch der Grund, warum man in einer IBM i Storage Lösung immer mehrere logische Laufwerke und nicht 1 großes definieren muss. Das Betriebssystem ist einfach komplett darauf ausgelegt, viele Laufwerke zu haben und benötigt diese Situation um performant zu laufen.