Ziele und Abgrenzungen
Von High Availability (HA) spricht man wenn ein System nach einem Ausfall
automatisch auf einem anderen (Ausfall-System) weiterlaufen soll. Es stehen verschiedene
Möglichkeiten, je nach Anforderung zur Verfügung. Bewusst wird in der folgenden
Zusammenstellung nicht auf die Ausfallsicherheit von Platten (Disk-Arrays) mit den
entsprechenden RAID-Levels eingegangen.
Grundsätzlich stehen folgende Möglichkeiten zur
Verfügung
- Backup Tape Shipping
- Standby Databases
- Oracle Parallel Server
- Proprietäre Systeme (zB HP-Service-Guard, VERITAS-AXXiON)
- Oracle Multimaster Replication
- Geo-Mirroring
|
Backup Tape Shipping
Tape wird auf einem Ausfallsystem nach einem Ausfall des produktiven
System eingelesen. Das Failover-System muss gleich vorkonfiguriert sein wie das
Produktivsystem.
Vorteile
|
- Kostengünstige Möglichkeit
- Failover-Site als Testumgebung nutzen
|
Nachteile
|
- System fällt längere Zeit aus
- Fehleranfällig (geschultes Personal nötig
- Failover-Maschine muss kompatibel zu Primary sein
- Datenverlust möglich
|
Standby Database
Eine Standby Database wird mit den offline Redologs laufend oder bei
Bedarf aktuell gehalten. Die offline Redolog-Files werden via Tape oder über NFS zur
Failover Datenbank geschickt.
Vorteile
|
- Relativ einfach zu implementieren
- Via NFS kann Failover-DB nahezu aktuell gehalten werden
- Auch als Geo-Mirroring Variante tauglich (Standortwechsel
|
Nachteile
|
|
Proprietäre Systeme
Proprietäre Systemen wie HP-Service-Guard oder VERITAS-AXXiON ist
gemeinsam, dass die Failover-Datenbank auf den Secondary-Host «gezügelt»
werden. Es erfolgt also in jedem Fall ein Shutdown der Datenbank.
Vorteile
|
- Nur kurzer Unterbruch der DB und Applikationen.
- Failover-System kann für andere Zwecke benutzt werden.
- Relativ bewährte Technologie, gutes Know-How vorhanden.
- Auch Applikationen können auf diese Weise überwacht werden.
|
Nachteile
|
- SHUTDOWN ABORT kann zu korrupter DB führen.
- Sehr viel Memory-Bedarf um alle Instanzen auf einem Host zu betreiben
|
Proprietäre Systeme eignen sich hervorragend für
Application-Failover‘s, aber weniger für echte DB-Failover, da in jedem Fall die
Datenbank auf dem Secondary Host neu gestartet werden muss.
Weitere Informationen: http://www.veritas.com
Oracle Parallel Server
Oracle Parallel Server und Multimaster Replication stellen eine
gleichzeitig verfügbare gespiegelte DB-Instanz zur Verfügung, sie bieten also die
grösste Ausfallsicherheit an. Das Ziel des Oracle Parallel Servers ist nebst der
HA-Komponente die parallele Verarbeitung von Daten. Dies kann jedoch nur bei gut
parallisierten Applikationen genutzt werden, ansonsten kann die Performance sogar
schlechter werden. Dies inbesondere dann, wenn mehrere DB-Instanzen die gleichen DB-Blocks
verändern müssen. Oracle Parallel Server zeichnet sich durch folgende Merkmale
aus:
Vorteile
|
- Gespiegelte Instanzen (parallele Verarbeitung), in der Skizze sind die
Instanzen Instance-1 und Instance-1‘ parallele Instanzen. Die Instanz-2 ist
eine ganz normale DB-Instanz.
- Jede Instanz hat seine eigenen Redolog-Files.
- Ein Recovery kann an jeder Instanz eingespielt werden, die anderen Instanzen
werden automatisch nachgefahren.
- Query-transparenter Failover, das heisst es erfolgt kein DB-Shutdown.
- Offene Transaktionen werden bei einem Failover mit einem Rollback
rückgängig gemacht.
- Nur kurze «Black-Out Phase» bei einem Failover.
- SQL*NET Client‘s werden automatisch auf Failoversystem geroutet, es
erfolgt aber ein Connect und Reconnect.
- Connect Load Balancing (automatische Lastverteilung) der Clients.
- OPS ist OLTP fähig unter Oracle-8, durch fine grain Locking.
- Oracle Enterprise Manager unterstützt OPS.
- Integrierter DLM (Distributed Lock Manager) unter Oracle-8
|
Nachteile
|
- Ein Applikationsfailover kann mit OPS nicht durchgeführt werden, OPS
richtet sich ausschliesslich an die Oracle-Datenbank.
- Für die Shared Disks ist zwingend ein RAW-Device erforderlich.
- Teuer, ca SFR 750.-- pro connected User.
- Relativ anspruchsvoll im Betrieb, ein gut ausgebildetes Betreiberteam ist
notwendig.
|
Multimaster Replikation
Multimaster Replikationen sichern auch ein Site-Failure ab (Feuer,
Wasser, Zerstörung, etc). Alle DB-Änderungen werden asynchron auf die andere
Master-Site transferiert. UPDATES sind auf allen Knoten möglich.
Vorteile
|
- Site Failure abgedeckt.
- Keine «Black-Out» Phase nach Failover.
- Nodes können von unterschiedlichen Herstellern sein
|
Nachteile
|
- Komplexe Konfiguration, anspruchsvoll im Betrieb, ein gut ausgebildetes
Betreiberteam ist notwendig.
- Conflict resolution kann anspruchsvoll werden
- Datenverlust ist möglich da eine asynchrone Replikation erfolgt.
|
|