Hochverfügbarer TSM Server - PROFI Engineering Systems AG
Hochverfügbarer TSM Server - PROFI Engineering Systems AG
Hochverfügbarer TSM Server - PROFI Engineering Systems AG
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
DEN <strong>TSM</strong> SERVER<br />
HOCHVERFÜGBAR MACHEN<br />
Tipps zur Realisierung
<strong>AG</strong>ENDA<br />
01 Ist eine HA-Lösung für <strong>TSM</strong> erforderlich<br />
02 Besonderheiten bei <strong>TSM</strong> Version 6<br />
03 Methoden der Absicherung des <strong>TSM</strong>-Betriebs<br />
04 Entscheidungskriterien<br />
05 Erfahrungen aus <strong>PROFI</strong>-Projekten<br />
06 Diskussion<br />
2<br />
28.10.2013<br />
WEBCast <strong>TSM</strong> hochverfügbar machen
<strong>AG</strong>ENDA<br />
01 Ist eine HA-Lösung für <strong>TSM</strong> erforderlich<br />
02 Besonderheiten bei <strong>TSM</strong> Version 6<br />
03 Methoden der Absicherung des <strong>TSM</strong>-Betriebs<br />
04 Entscheidungskriterien<br />
05 Erfahrungen aus <strong>PROFI</strong>-Projekten<br />
06 Diskussion<br />
3<br />
28.10.2013<br />
WEBCast <strong>TSM</strong> hochverfügbar machen
ANFORDERUNGEN AN DEN SERVICE ‚BACKUP‘<br />
• Datensicherung soll die erstellten Daten möglichst<br />
unauffällig lesen und sicher auf einem externen<br />
Datenträger speichern.<br />
• Der Service ‚Datensicherung‘ muss in der Lage sein,<br />
Dateien auf Anforderung wieder herstellen zu können.<br />
• Wie lange das dauern darf, hängt von den<br />
individuellen Ansprüchen der Anwender bzw. der<br />
Wertigkeit innerhalb des Produktionsbetriebes ab.<br />
• Für die normale Arbeit des IT-Anwenders ist<br />
Datensicherung nicht wirklich erforderlich.<br />
4<br />
28.10.2013 WEBCast <strong>TSM</strong> hochverfügbar machen
ANFORDERUNGEN AN DEN SERVICE ‚BACKUP‘<br />
Das führt zu der Frage:<br />
Brauche ich eine HA-Lösung für <strong>TSM</strong>?<br />
5<br />
28.10.2013 WEBCast <strong>TSM</strong> hochverfügbar machen
ANFORDERUNGEN AN DEN SERVICE ‚BACKUP‘<br />
• Hochverfügbarkeit unterscheidet sich allerdings von<br />
Katastrophenvorsorge!<br />
• Nach einer Katastrophe wird in der Regel eine passive<br />
Systemumgebung aktiviert.<br />
• Der Aufsetzpunkt (für Wiederherstellungen) kann<br />
dabei variieren.<br />
• Wichtig ist die Verfügbarkeit der gesicherten Daten!<br />
6<br />
28.10.2013 WEBCast <strong>TSM</strong> hochverfügbar machen
ANFORDERUNGEN AN DEN SERVICE ‚BACKUP‘<br />
• Der Anspruch für eine Hochverfügbarkeit bedeutet:<br />
• Auf den Service ‚Datensicherung‘ kann nur eine kurze<br />
Zeit (< 1 Stunde?) verzichtet werden.<br />
• Wichtig ist neben der Verfügbarkeit der gesicherten<br />
Daten auch die Betriebsfähigkeit des <strong>TSM</strong>-<strong>Server</strong>s.<br />
7<br />
28.10.2013 WEBCast <strong>TSM</strong> hochverfügbar machen
ANFORDERUNGEN AN DEN SERVICE ‚BACKUP‘<br />
• Wo ist Hochverfügbarkeit erforderlich<br />
• Sicherung von Datenbank-Transaktions-Logs<br />
• Archiv-Systeme mit <strong>TSM</strong> als Back-End<br />
• HSM – verwaltete Speichersysteme<br />
• Hier kann ein Ausfall des <strong>TSM</strong>-<strong>Server</strong>s zu ernsten<br />
Produktions-Störungen führen.<br />
8<br />
28.10.2013 WEBCast <strong>TSM</strong> hochverfügbar machen
<strong>AG</strong>ENDA<br />
01 Ist eine HA-Lösung für <strong>TSM</strong> erforderlich<br />
02 Besonderheiten bei <strong>TSM</strong> Version 6<br />
03 Methoden der Absicherung des <strong>TSM</strong>-Betriebs<br />
04 Entscheidungskriterien<br />
05 Erfahrungen aus <strong>PROFI</strong>-Projekten<br />
06 Diskussion<br />
9<br />
28.10.2013<br />
WEBCast <strong>TSM</strong> hochverfügbar machen
BESONDERHEITEN BEI <strong>TSM</strong> V6<br />
• Der große Unterschied zur Version 5 ist die Datenbank<br />
• V5 hatte DB mit bis zu drei identischen Dateien (DB und DB-<br />
Copy), ebenso das Recovery-Log<br />
• Mit mindestens einer Version konnte gestartet werden!<br />
• V6 benutzt ein originales DB2 (Enterprise Edition)<br />
• Tablespaces und Transaktions-Logs gibt es nur einmal<br />
• Festplattenfehler führen immer zu DB2-Recovery-Aufgaben<br />
10<br />
28.10.2013 WEBCast <strong>TSM</strong> hochverfügbar machen
<strong>AG</strong>ENDA<br />
01 Ist eine HA-Lösung für <strong>TSM</strong> erforderlich<br />
02 Besonderheiten bei <strong>TSM</strong> Version 6<br />
03 Methoden der Absicherung des <strong>TSM</strong>-Betriebs<br />
04 Entscheidungskriterien<br />
05 Erfahrungen aus <strong>PROFI</strong>-Projekten<br />
06 Diskussion<br />
11<br />
28.10.2013<br />
WEBCast <strong>TSM</strong> hochverfügbar machen
METHODEN ZUR ABSICHERUNG DES <strong>TSM</strong>-SERVERS<br />
• Tape Rotation 2 RZs, 2 <strong>Server</strong>, DRM zur Wiederherstellung des <strong>TSM</strong>-<br />
<strong>Server</strong>s<br />
• Datenspiegelung 2 RZs, 2 <strong>Server</strong>, Remote Volume Mirror mit Hilfe der<br />
Festplatten-Speicher<br />
• <strong>TSM</strong> Node Replication 2 RZs, 2 unabhängige <strong>TSM</strong>-<strong>Server</strong> und Storage<br />
Pools<br />
• HADR Replikation (mit <strong>TSM</strong> V6 möglich) 2 RZs, 2 <strong>TSM</strong>-<strong>Server</strong>,<br />
synchrone <strong>TSM</strong>-Datenbank<br />
• <strong>TSM</strong>-<strong>Server</strong> als geclusterte Systeme (AIX mit PowerHA, Linux mit Linux-<br />
HA)<br />
12<br />
28.10.2013 WEBCast <strong>TSM</strong> hochverfügbar machen
TAPE ROTATION<br />
• Magnetbänder werden ausgelagert und transportiert<br />
• Die Entfernung zwischen den beiden Standorten ist nicht entscheidend<br />
(keine Leitungskosten, kein Bandbreiten-Problem)<br />
• Ist eine Cold-StandBy-Lösung, weil eine Wiederherstellung des <strong>TSM</strong>-<br />
<strong>Server</strong>s aus den ausgelagerten Datenbeständen einer Wiederaufnahme<br />
des <strong>TSM</strong>-Betriebs vorausgehen muss.<br />
• Ein weiteres Problem:<br />
Die manuelle Verwaltung der Bandbestände muss besonders sorgfältig<br />
erfolgen.<br />
13<br />
28.10.2013 WEBCast <strong>TSM</strong> hochverfügbar machen
DATENSPIEGELUNG<br />
• Voraussetzung: RZs sind in LWL-Reichweite und die Festplattensysteme<br />
können die Daten spiegeln (PPRC, RVM o.ä.)<br />
• Am Backup-Standort muss ein <strong>Server</strong> vorgehalten werden.<br />
• Die Umschaltung beginnt mit der Aktivierung des Festplattenspiegels<br />
als aktive Seite.<br />
• Die Spiegelung muss konsistent sein (consistency groups)<br />
• Auf diese Art ist ein warmes StandBy-Szenario abbildbar, dass ohne<br />
Wiederherstellung der <strong>TSM</strong>-Datenbank auskommt.<br />
14<br />
28.10.2013 WEBCast <strong>TSM</strong> hochverfügbar machen
<strong>TSM</strong> NODE REPLICATION<br />
• Voraussetzung: Zwei unabhängige <strong>TSM</strong>-<strong>Server</strong>, die über Netzwerk-<br />
Verbindungen miteinander in Kontakt treten können.<br />
• Die Replikation erfolgt auf Basis von <strong>TSM</strong> Nodes<br />
• Management-Regeln können differieren, viele Spielarten sind damit<br />
möglich.<br />
• Die verfügbare Netzwerk-Bandbreite zwischen den beiden <strong>Server</strong>n<br />
bestimmt die Leistungs-Fähigkeit.<br />
• Der gesicherte Client kennt nur einen <strong>Server</strong>. Das soll sich aber in<br />
Zukunft ändern.<br />
15<br />
28.10.2013 WEBCast <strong>TSM</strong> hochverfügbar machen
HADR REPLIKATION<br />
• Voraussetzung: Zwei unabhängige <strong>TSM</strong>-<strong>Server</strong>, die über Netzwerk-<br />
Verbindungen miteinander in Kontakt treten können.<br />
• HADR (high availability disaster recovery) ist eine Funktion des DB2 und<br />
stellt die Replikation der <strong>TSM</strong> Datenbank durch DB2 Log-Shipping zur<br />
Verfügung.<br />
• Auf dem zweiten <strong>TSM</strong>-<strong>Server</strong> läuft eine DB2-Datenbank-Instanz, die von<br />
der primären Datenbank synchron gehalten wird.<br />
• Für die Einrichtung sind Eingriffe in die DB2-Konfiguration der <strong>TSM</strong>-<br />
<strong>Server</strong> notwendig.<br />
• Die Replikation betrifft nur die Datenbank. Die Verfügbarkeit der Storage<br />
Pools ist gesondert zu betrachten.<br />
16<br />
28.10.2013 WEBCast <strong>TSM</strong> hochverfügbar machen
<strong>TSM</strong>-SERVER ALS GECLUSTERTE SYSTEME<br />
• Voraussetzung:<br />
Software zur Verwaltung der Cluster-Ressourcen (<strong>TSM</strong>, Speicher,<br />
Netzwerk-Adressen) und gemeinsam nutzbare Datenspeicher-Einheiten.<br />
• <strong>TSM</strong>, die Storage-Pools und die <strong>Server</strong>-Adresse werden als Cluster-<br />
Ressourcen zwischen mehreren gleichartigen <strong>Server</strong>-Systemen<br />
geschwenkt.<br />
• Die Cluster-Verwaltung übernimmt die Steuerung.<br />
• Wenige bzw. keine manuellen Eingriffe für die Umschaltung erforderlich.<br />
17<br />
28.10.2013 WEBCast <strong>TSM</strong> hochverfügbar machen
<strong>AG</strong>ENDA<br />
01 Ist eine HA-Lösung für <strong>TSM</strong> erforderlich<br />
02 Besonderheiten bei <strong>TSM</strong> Version 6<br />
03 Methoden der Absicherung des <strong>TSM</strong>-Betriebs<br />
04 Entscheidungskriterien<br />
05 Erfahrungen aus <strong>PROFI</strong>-Projekten<br />
06 Diskussion<br />
18<br />
28.10.2013<br />
WEBCast <strong>TSM</strong> hochverfügbar machen
DIE VERSCHIEDENEN SZENARIEN<br />
Ausfall Cluster HADR Node Replikation Festplatten-Spiegel Tape Rotation<br />
<strong>Server</strong>-Hardware<br />
X<br />
Festplatte für <strong>TSM</strong> DB X X X X<br />
RZ-Raum (X) X X X X<br />
notwendige Aktionen<br />
Crash Recovery<br />
der Datenbank<br />
Crash Recovery<br />
und Audit der<br />
Storage Pools<br />
Crash Recovery und Audit<br />
der Storage Pools<br />
Restore der <strong>TSM</strong> DB,<br />
Audit der Storage<br />
Pools<br />
19<br />
28.10.2013 WEBCast <strong>TSM</strong> hochverfügbar machen
<strong>AG</strong>ENDA<br />
01 Ist eine HA-Lösung für <strong>TSM</strong> erforderlich<br />
02 Besonderheiten bei <strong>TSM</strong> Version 6<br />
03 Methoden der Absicherung des <strong>TSM</strong>-Betriebs<br />
04 Entscheidungskriterien<br />
05 Beispiele aus <strong>PROFI</strong>-Projekten<br />
06 Diskussion<br />
20<br />
28.10.2013<br />
WEBCast <strong>TSM</strong> hochverfügbar machen
<strong>PROFI</strong> – ERFAHRUNGEN MIT HADR<br />
Die schlechte Nachricht zuerst:<br />
HADR ist nur sehr bedingt geeignet<br />
<strong>TSM</strong> weiß nichts von DB2<br />
DB2 weiß nichts von <strong>TSM</strong> (und seinen Besonderheiten)<br />
Start und Stop von DB2 passiert im <strong>TSM</strong> – Start bzw. Stop<br />
Ein Stop des <strong>TSM</strong>-<strong>Server</strong>s (geplant oder ungeplant) unterbricht die<br />
HADR Partnerschaft (db2stop force !!)<br />
21<br />
28.10.2013 WEBCast <strong>TSM</strong> hochverfügbar machen
BEISPIEL MIT NODE REPLIKATION<br />
Kunde: Photo-Dienstleister<br />
• 2 RZs (innerhalb der Stadtgrenzen)<br />
• 10Gb/s Bandbreite zwischen den Standorten<br />
• Je einen <strong>TSM</strong>-<strong>Server</strong> in jedem RZ<br />
• Diskpools im RZ1 (rd. 120 TB, 70% used), Tape-Library im RZ2<br />
• Das tägliche Sicherungs-Volumen kann zeitlich problemlos repliziert werden ( Bandbreite ! )<br />
• Bei Ausfall des Haupt-<strong>Server</strong>s müssen vor einem Restore die Options-Dateien geändert<br />
werden ( wird vielleicht in Zukunft nicht mehr nötig sein )<br />
• Keine COPYPOOLS ! Bei Ausfall des Diskpools müssen alle Daten zurück repliziert werden<br />
• Empfehlung:<br />
• Copypools auf der primären Seite mit einplanen.<br />
• Für geeignet große Bandbreite sorgen<br />
22<br />
28.10.2013 WEBCast <strong>TSM</strong> hochverfügbar machen
BEISPIEL MIT FESTPLATTENSPIEGELUNG<br />
Kunde: Zeitungsverlag<br />
• Hauptanwendung: SAP System mit Sicherung über TDP for ERP<br />
• 2 Rechnerräume (im gleichen Gebäude)<br />
• SAN LWL-Verkabelung zwischen den RZs<br />
• Je einen <strong>TSM</strong>-<strong>Server</strong> in jedem RZ<br />
• Diskpools im RZ1, Tape-Library im RZ2<br />
• DB-Instanz über zwei Festplattensysteme V7000 mit LVM gespiegelt<br />
• Linux-HA Cluster<br />
• DB2 Volumegruppe und Diskpools sind Cluster-Ressourcen<br />
• Einarbeitung in Linux-HA ist etwas aufwändiger<br />
• System läuft seit mehreren Monaten störungsfrei<br />
• Empfehlung:<br />
• Copypool-Tapes auslagern<br />
23<br />
28.10.2013 WEBCast <strong>TSM</strong> hochverfügbar machen
BEISPIEL MIT SHARED DISK<br />
Kunde: Fernsehsender<br />
• Hauptanwendung: HSM-Archiv für Videodaten<br />
• 2 Rechnerräume (auf dem Campus – 500m Entfernung)<br />
• SAN LWL-Verkabelung zwischen den RZs<br />
• GPFS – Cluster aus drei Knoten ,Linux-HA Cluster über diesen GPFS-Cluster<br />
• <strong>TSM</strong>-<strong>Server</strong> ist Cluster Ressource<br />
• DB-Instanz auf GPFS-Filesystem<br />
• Kleine Diskpools, Backup und HSM-Archiv auf getrennte Tape Libraries<br />
• Linux-HA-Umgebung ist aufwändig (drei Knoten, viele Ressourcen, Anspruch auf<br />
bedienerlosen Betrieb)<br />
• System läuft schon seit mehreren Jahren so (früher schon mit V5)<br />
• Empfehlung:<br />
• Trennung der Cluster-Nodes – Verteilung auf verschiedene <strong>Server</strong>-Räume<br />
24<br />
28.10.2013 WEBCast <strong>TSM</strong> hochverfügbar machen
ZUSAMMENFASSUNG<br />
Meine Empfehlungen<br />
• Wenn SAN-Verbindung zwischen den <strong>TSM</strong>-<strong>Server</strong>n möglich ist<br />
• <strong>TSM</strong> DB-Instanz als GPFS-Filesystem oder LVM-Spiegel über zwei<br />
Festplattensysteme<br />
• <strong>TSM</strong> als Cluster-System<br />
• Bei ausreichender Netzwerk-Bandbreite zwischen den <strong>TSM</strong>-<strong>Server</strong>n<br />
• Node-Replikation (uni- oder bi-direktional)<br />
• Copy-Pools auch auf der primären <strong>Server</strong>-Seite<br />
25<br />
28.10.2013 WEBCast <strong>TSM</strong> hochverfügbar machen
<strong>AG</strong>ENDA<br />
01 Ist eine HA-Lösung für <strong>TSM</strong> erforderlich<br />
02 Besonderheiten bei <strong>TSM</strong> Version 6<br />
03 Methoden der Absicherung des <strong>TSM</strong>-Betriebs<br />
04 Entscheidungskriterien<br />
05 Beispiele aus <strong>PROFI</strong>-Projekten<br />
06 Diskussion<br />
26<br />
28.10.2013<br />
WEBCast <strong>TSM</strong> hochverfügbar machen
VIELEN DANK FÜR<br />
IHRE AUFMERKSAMKEIT<br />
ROLF MEYER<br />
SENIOR SYSTEMINGENIEUR<br />
TEL: 040-636699-0<br />
EMAIL: R.MEYER@<strong>PROFI</strong>-<strong>AG</strong>.DE