View Full Version : Redundante Hardware
holgerscherer
10-02-06, 00:52
Was sind noch sonst für Controller drin?? Du hast immer einen Single Point of Failure, weil die i5 nur ein Planar Board hat auf der z.B. schon 2 Gigabit Controller drauf sind.
Gruß Jörg
Jupp, auf der 520 gibt es so viele mögliche SPOF äh Single points of fehlerhaft, dass es sicherer wäre, eine zweite 520 daneben zu stellen und eine der bekannten HA-Lösungen zu nehmen :)
-h
Vielen Dank für eure Antworten. Ich habe gerade mit bentsetzen festgestellt, dass in dieser Maschine 32 Disks aus 3 verschiedenen Units (520 und 2 Erweiterungseinheiten) zu einem ASP zugeordnet sind. Das bedeutet doch, dass sobald eine Erweiterungseinheit ausfällt, mir das ganze Array um die Ohren fliegt, richtig?
sorry, ich meinte, dass alle 32 disks zu einem ASP gehören. diese sind zwar in 5 Arrays aufgesplittet, bringt aber dennoch nicht viel, da ja alle Arrays zum gleichen ASP gehören, und diese wieder aus platten verschiedener Einheiten bestehen. Somit wenn eine Array ausfällt, ist der komplette ASP hinüber, oder?
AS400.lehrling
10-02-06, 16:39
sorry, ich meinte, dass alle 32 disks zu einem ASP gehören. diese sind zwar in 5 Arrays aufgesplittet, bringt aber dennoch nicht viel, da ja alle Arrays zum gleichen ASP gehören, und diese wieder aus platten verschiedener Einheiten bestehen. Somit wenn eine Array ausfällt, ist der komplette ASP hinüber, oder?
Tja , deswegen gibt es ja auch von IBM die Empfelung (glaube zumindest das diese von Big Blu ist):) Die Komplette Maschiene noch einmal mit selbige Configuration daneben zu stellen und als alternatives Device ins Netzwerk ein zu binden.
Dan kann die Reserve Maschiene fast sofort übernehmen wenn die andere sich den Magen verdorben hat:D.
Du kannst dabei das Management automatisiert Prüfen lassen ob die Hauptmaschiene in Begriff ist zu kränkeln und die Reserve Maschiene rechtzeitig einen IPL ausführen lassen, sowie ein rsync für die Datenbank auslösen damit wirklich kein Datenschwund eintritt.
Für das Management kannst du eine 170er daneben stellen (glaube wieder) das sowas ebenfalls von IBM empfolen wird.
Mit freundlichen Grüßen AS400.lehrling
@MTU
Hallo, also Du hast 32 Platten für den ASP1. Du sprichst von 5 Array´s; Was verstehst Du unter Array?? RAID 1 oder RAID 5 oder einen anderer RAID-Verbund???
Gruß Jörg
Hallo,
hier scheinen doch ein paar Dinge durcheinander zu gehen:
- Raid 5 ist Redundanz auf Plattenebene, wenn der Controlller oder Bus abraucht ist Ende Gelände
- bei Spiegelung kann man bis auf Buslevel alles doppeln, außer aktive Loadsource und CPU
- sehen tut man das im SST in der Plattenkonfiguration (DSPHDWRSC müsste es auch tun)
- wenn in einem ASP was fort ist, ist selbiger komplett weg
- wenn der System ASP weg ist, dann ist die Maschine komplett weg
- wenn einem das nicht doppelt genug ist, dann bleiben derzeit nur zwei Wege:
- Software HA (= Hoffentlich Alles da) Lösungen
- Mainframe oder AIX (oder anderes Unix) mit gespiegelten Clustern
Solange die AS400 letzteres aus Marketing Gründen nicht darf, muss man auf das letzte Quentchen verzichten, oder Ausfallzeiten in Kauf nehmen, oder die Plattform wechseln. Die Hoffnung, dass man ausfallende Hardware durch Software Lösungen kompensieren kann - ob man der trauen soll???
mfg
Dieter Bender
sorry, ich meinte, dass alle 32 disks zu einem ASP gehören. diese sind zwar in 5 Arrays aufgesplittet, bringt aber dennoch nicht viel, da ja alle Arrays zum gleichen ASP gehören, und diese wieder aus platten verschiedener Einheiten bestehen. Somit wenn eine Array ausfällt, ist der komplette ASP hinüber, oder?
sidoc_Support
18-02-06, 10:34
Hallo,
redundante Platten bzw. Controller sind natürlich sinnvoll. Koscht halt was. Das restliche System fällt normalerweise nicht aus. Platten und Netzteile sind die Einheiten mit dem größten "Risiko". Ich habe in 25 Jahren iSeries noch nie ein defektes Systemboard oder defekten Controller gesehen. Das schlimmste war mal ein leerer Akku auf einem Raid-Controller. Konnte man günstig reparieren - hat nur den Systembetrieb verlangsamt, da dann der Schreibcache ausfällt. Platten gabs aber schon viele viele viele kaputte... :-(
Es kann durchaus sein, daß die Platten in den 3 Quellen so konfiguriert sind, daß ruhig eine Platte oder sogar ein Contoller ausfallen können. Vielleicht postest Du mal den WRKDSKSTS -> F11 oder STRSST -> 3 -> 1 -> 3 (Display disk configuration protection)
Gruß
Martin
http://www.sidoc.de
Hallo mtu,
es ist so wie Du vermutest. Wenn eine Expansion-Unit 509x/059x aussteigt bleibt die i5 stehen weil dann ein Teil der Platten bzw. des ASP's fehlt. Aber auch ein Defekt auf dem internen #5709-Disk-Controller oder das Mainboard, das OP-Panel etc. kann das System zum Stillstand zwingen.
Sicherheit gegen so einen Ausfall bringt eine zweite, gespiegelte Maschine mit HA-Software oder eine zweite Maschine mit XSM-Cross-Site-Mirror. Die Journaldaten können auch per Remotecopy in ein externes Rechenzentrum übertragen werden wo eine systen (oder z.B. eine partitionierte i5) läuft die im Notfall die Produktion aufrecht hält. Bei Bedarf kann ich weitere Infotmationen liefern.
Gruß
mida
Vielen Dank für eure Antworten. Wir werden uns nun wohl eine 2. Maschine als Backup anschaffen, vermutlich auch ein geeignetes Tool wie iCluster. Somit können wir dann eine sehr hohe Uptime garantieren.
Vielen Dank nochmals!
Peter Kosel
21-02-06, 09:20
Hallo mtu,
Du hast schon Recht, auch Controler sollten redundant ausgelegt sein.
Auch mit deinen Erweiterungseinheiten hast du recht. fällt eine aus, hast Du ein Problem. Du solltest mal mit deinem Systemhaus oder der IBM sprechen. von denen erhälst du auch einen Ausdruck aus dem Konfigurator (oder auch LPAR Validation Tool) Am sichersten ist wahrscheinlich wirklich eine HA-Lösung oder eine Auslagerung des Speichers auf eine DS-Irgendwas und dann Anbindung mit Multipath und Spiegelung auf Hardwareebene. Kostet aber alles ne Menge Geld....
PS wir haben das alles gerade hinter uns bei Bedarf maile mich kurz an.