Wende:RAC-Fehler durch falsches Hinzufügen der Festplatte
Vor kurzem hängt eine Produktionsbibliothek
Der Grund für das Hängenbleiben der Datenbank liegt darin, dass alle Festplatten, die dem Dateisystem der Datenbank entsprechen, verloren gegangen sind.,Aber sehen Sie sich das Hintergrundprotokoll an
JETZT-00204dieser Fehler,Oder Baidu warf einen Blick darauf und sah den Artikel von Elder Yang,Also Einkommen für meinen eigenen Blog,
Bei den folgenden Fehlern führte das unsachgemäße Hinzufügen von Datenträgern unter RAC dazu, dass die Datenbank abstürzte。
Dies ist ein echter Wartungsprozess für eine Produktionsumgebung,Aufgrund von Platzmangel in der RAC-Testumgebung,Planen Sie daher ein
ASM-Erweiterungsraum,Beim Hinzufügen von neuem Speicherplatz zu ASM ist jedoch ein Fehler aufgetreten,Es gibt viele solcher Probleme
Die Produktionsumgebung des Benutzers kann ebenfalls auftreten。
Die Arbeitsschritte der Raumerweiterung sind wie folgt:
Das DBCA-Tool auf Knoten 1 der RAC-Umgebung gestartet, um das ASM-Gerät zu verwalten;
Weil das neu hinzugefügte Raw-Gerät in der grafischen Oberfläche von ASM nicht zu sehen ist;
Der Root-Benutzer gewährt dem Oracle-Benutzer auf dem Betriebssystem Zugriff auf das Raw-Gerät;
zu dieser Zeit,Diese Rohgeräte sind bereits von den Kandidatenfestplatten in der grafischen Oberfläche zu sehen;
Das Raw-Gerät wurde über die grafische Benutzeroberfläche zur Datenträgergruppe hinzugefügt。
Aber diese Operation wirft zwei Fehler:ORA-15032 bzw. ORA-15075。
Sehen Sie sich zunächst an, wie diese beiden Fehler in der offiziellen Dokumentation von Oracle beschrieben werden:
ORA-15032: nicht alle Umbauten durchgeführt
Ursache: Mindestens eine ALTER DISKGROUP-Aktion ist fehlgeschlagen.
Handlung: Überprüfen Sie die anderen zusammen mit ausgegebenen Nachrichten dieser zusammenfassende Fehler.
ORA-15075: Scheibe(s) sind nicht clusterweit sichtbar
Ursache: Ein Befehl ALTER DISKGROUP ADD DISK hat eine Festplatte angegeben, die dies könnte
nicht von einem oder mehreren Knoten in einer RAC-Cluster-Konfiguration erkannt werden.
Handlung: Ermitteln Sie anhand von GV$OSM_DISK, welche Festplatten das Problem verursachen
feste Ansicht. Überprüfen Sie die Betriebssystemberechtigungen für das Gerät und den Speicher
Subsystemkonfiguration auf jedem Knoten in einem RAC-Cluster, der die Festplatte nicht identifizieren kann.
Tatsächlich sind die Informationen im ORA-15075-Fehler offensichtlich genug。Laut dieser Fehleranalyse sollte sich das schnell finden lassen
Ursache des Problems。Sondern wegen anderer Unfälle,Die Richtung zur Lösung des Problems ist abgewichen。
Dieser Fehler verursachte das seltsame Verhalten:Nach falschen Angaben zu urteilen,Vorgang ist fehlgeschlagen,Aber die Inspektion ergab, dass diese nackten Geräte
Bereits sichtbar in der ASM-Konfiguration von DBCA。
Während der Suche nach diesen beiden Fehlermeldungen,Ein Kollege sagte mir, dass die Instanz auf Knoten 2 nicht verbunden werden konnte。
Durch die Betriebssystembefehlsprüfung wird festgestellt, dass die Datenbankinstanz 2 heruntergefahren wurde,Die ASM-Instanz auf diesem Knoten ist jedoch noch vorhanden。
Das Seltsame an diesem Phänomen ist das:Fehler, die durch Operationen auf ASM verursacht werden,Die aktuelle ASM-Instanz weist keine Fehler auf,aber es gibt noch einen
Eine Datenbankinstanz wird heruntergefahren。
Überprüfen Sie die Warndatei wie folgt,Die auffällige Informationsanzeige ist ein Kontrolldatei-Zugriffsfehler:
$ Schwanz -500 Alarm*
Liste der Knoten:
……
Du Mar 29 17:25:36 2007
ERFOLG: Festplatte DISK_0017(17.4042303525) zur Diskgruppe DISK hinzugefügt
ERFOLG: Festplatte DISK_0018(18.4042303520) zur Diskgruppe DISK hinzugefügt
ERFOLG: Festplatte DISK_0019(19.4042303521) zur Diskgruppe DISK hinzugefügt
ERFOLG: Festplatte DISK_0020(20.4042303522) zur Diskgruppe DISK hinzugefügt
ERFOLG: Festplatte DISK_0021(21.4042303523) zur Diskgruppe DISK hinzugefügt
ERFOLG: Festplatte DISK_0022(22.4042303524) zur Diskgruppe DISK hinzugefügt
Du Mar 29 17:29:45 2007
ERFOLG: Datenträgergruppe DISK wurde getrennt
ERFOLG: Datenträgergruppe DISK wurde getrennt
Du Mar 29 17:29:46 2007
Fehler in der Datei /data/oracle/admin/testrac/bdump/testrac2_lmon_2789.trc:
JETZT-00202: Steuerdatei:’+DISK/testrac/control01.ctl’
ORA-15078: Die Bereitstellung der ASM-Datenträgergruppe wurde erzwungen
Du Mar 29 17:29:46 2007
LMON: Instanz wird aufgrund eines Fehlers beendet 204
Du Mar 29 17:29:46 2007
Fehler in der Datei /data/oracle/admin/testrac/bdump/testrac2_pmon_2754.trc:
JETZT-00204: Fehler beim Lesen(Block , # Blöcke ) der Steuerdatei
Du Mar 29 17:29:46 2007
Der Systemstatusauszug wird für die lokale Instanz erstellt
Du Mar 29 17:29:46 2007
Fehler in der Datei /data/oracle/admin/testrac/bdump/testrac2_lms1_2797.trc:
JETZT-00204: Fehler beim Lesen(Block , # Blöcke ) der Steuerdatei
Du Mar 29 17:29:46 2007
Fehler in der Datei /data/oracle/admin/testrac/bdump/testrac2_lms0_2793.trc:
JETZT-00204: Fehler beim Lesen(Block , # Blöcke ) der Steuerdatei
Systemstatus wurde in die Ablaufverfolgungsdatei /data/oracle/admin/testrac/bdump/ ausgegeben
testrac2_diag_2756.trc
Du Mar 29 17:29:47 2007
Fehler in der Datei /data/oracle/admin/testrac/bdump/testrac2_j001_677.trc:
JETZT-00204: Fehler beim Lesen der Steuerdatei(Stück , # Stück )
Du Mar 29 17:29:47 2007
Fehler in der Datei /data/oracle/admin/testrac/bdump/testrac2_j000_3675.trc:
JETZT-00204: Fehler beim Lesen der Steuerdatei(Stück , # Stück )
Du Mar 29 17:29:47 2007
Fehler in der Datei /data/oracle/admin/testrac/bdump/testrac2_rbal_2982.trc:
JETZT-00204: Fehler beim Lesen(Block , # Blöcke ) der Steuerdatei
Du Mar 29 17:29:52 2007
Instanz von LMON beendet, pid = 2789
versuchen Sie, das System neu zu starten,Sehen Sie, welche Art von Fehlermeldung generiert wird,Die Display-Informationen, die ich dieses Mal sah, entpuppten sich als Fehler beim Lesen der Parameterdatei:
$ sqlplus “/ als sysdba”
mit Leerlauf verbunden。
SQL> Anlaufen
JETZT-01078: Fehler bei der Verarbeitung von Systemparametern
JETZT-01565: Fehler beim Identifizieren der Datei „+DISK/testrac/spfiletestrac.ora’
ORA-17503: kfdopn:2Datei +DISK/testrac/spfiletestrac.ora konnte nicht geöffnet werden
ORA-15077: konnte keine ASM-Instanz finden, die eine erforderliche Datenträgergruppe bedient
SQL> stilllegen
JETZT-01034: ORACLE nicht verfügbar
ORA-27101: Shared-Memory-Realm existiert nicht
SVR4-Fehler: 2: Keine solche Datei oder Ordner
Also, was ist los? Wenn Sie das Alarmprotokoll sorgfältig Zeile für Zeile analysieren,Tatsächlich wurde zu diesem Zeitpunkt die Warndatei
enthält offensichtlich die Fehlerursache:
ERFOLG: Datenträgergruppe DISK wurde entladen
ERFOLG: Datenträgergruppe DISK wurde entladen
Du Mar 29 17:29:46 2007
Fehler in der Datei /data/oracle/admin/testrac/bdump/testrac2_lmon_2789.trc:
JETZT-00202: Steuerdatei:’+DISK/testrac/control01.ctl’
ORA-15078: Die Bereitstellung der ASM-Datenträgergruppe wurde erzwungen
Du Mar 29 17:29:46 2007
Fehler in der Datei /data/oracle/admin/testrac/bdump/testrac2_lmon_2789.trc:
JETZT-00204: Fehler beim Lesen(Block 35, # Blöcke 1) der Steuerdatei
JETZT-00202: Steuerdatei:’+DISK/testrac/control01.ctl’
ORA-15078: Die Bereitstellung der ASM-Datenträgergruppe wurde zwangsweise aufgehoben
Die ASM-Datenträgergruppe wurde zuerst DISMOUNT,Daher wird es später natürlich Probleme beim Zugriff auf Dateien in ASM geben,
nurWenn wir die Protokolle lesen,Aufmerksamkeit ist leicht ersichtlich、einfach zu verstehen、vertraute Attraktion,oft übersehen
das eigentliche Problem,Das ist menschliche selektive Aufmerksamkeit.:
Fehler in der Datei /data/oracle/admin/testrac/bdump/testrac2_j001_677.trc:
JETZT-00204: Fehler beim Lesen der Steuerdatei(Stück , # Stück )
Du Mar 29 17:29:47 2007
Fehler in der Datei /data/oracle/admin/testrac/bdump/testrac2_j000_3675.trc:
JETZT-00204: Fehler beim Lesen der Steuerdatei(Stück , # Stück )
Du Mar 29 17:29:47 2007
Fehler in der Datei /data/oracle/admin/testrac/bdump/testrac2_rbal_2982.trc:
JETZT-00204: Fehler beim Lesen(Block , # Blöcke ) der Steuerdatei
Du Mar 29 17:29:52 2007
Instanz von LMON beendet, pid = 2789
Siehe diese ORA-204-Fehlermeldung,Gehen Sie davon aus, dass dies die Ursache des Problems ist。
Wenn Sie sich die nachfolgende Startfehlermeldung ansehen, können Sie das Problem tatsächlich erkennen:
ORA-15077: ASM-Instanz, die eine erforderliche Datenträgergruppe bedient, konnte nicht gefunden werden。
Die offizielle Dokumentation von Oracle beschreibt diesen Fehler als:
ORA-15077: ASM-Instanz, die eine erforderliche Datenträgergruppe bedient, konnte nicht gefunden werden
Ursache: Die Instanz konnte den angegebenen Vorgang nicht ausführen, weil dies möglich war
Suchen Sie keine erforderliche ASM-Instanz.
Handlung: Starten Sie eine ASM-Instanz und mounten Sie die erforderliche Datenträgergruppe.
Wenn Sie auf diesen Fall stoßen,Gleichzeitig stieß ich auf eine weitere Denkfalle:Ich bin gerade auf einen Fehler gestoßen,dieser Fehler
Die wichtigste Fehlermeldung ist ORA-17503: kfdopn:2 Datei +DISK/testrac/ konnte nicht geöffnet werden
spfiletestrac.ora。Ignorieren Sie also die obigen Schlüsselinformationen,Konzentrieren Sie sich stattdessen auf Fehler,und denke, dass diese Begegnung
Das Problem kann mit dem letzten Mal zusammenhängen。
Parameterdatei kann nicht gelesen werden,Wie es geht? Versuchen Sie zu diesem Zeitpunkt, die lokale pfile zum Starten der Datenbank zu verwenden:
SQL> Start pfile=/export/home/oracle/inittestrac2.ora
Die ORACLE-Instanz wurde gestartet。
Globaler Bereich des Gesamtsystems 2147483648 Bytes
Feste Größe 2030296 Bytes
Variable Größe 503317800 Bytes
Datenbankpuffer 1627389952 Bytes
Puffer wiederholen 14745600 Bytes
JETZT-00205: ?????????, ??????, ???????
Nachdem ein Fehler aufgetreten ist,wieder getäuscht,um die ORA zu überprüfen-00205Fehlermeldung。
JETZT-00205: Fehler beim Identifizieren der Steuerdatei, Weitere Informationen finden Sie im Warnprotokoll
Ursache: Das System konnte keine Steuerdatei mit dem angegebenen Namen und der angegebenen Größe finden.
Handlung: Überprüfen Sie, ob ALLE Steuerdateien online sind und ob es sich um dieselben Dateien handelt
die das System beim Kaltstart erstellt hat.
Bis festgestellt wird, dass die Steuerdatei selbst kein Problem hat – Instanz 1 wurde normal ausgeführt。Da habe ich mich selbst erkannt"sich verirren”。
Überprüfen Sie sorgfältig alle Fehlermeldungen und die Fehlerursache – das Hinzufügen einer Datenträgergruppe,endlich das Problem gefunden
der wahre Grund:Beim Autorisieren von Raw-Geräten,Nur auf Knoten 1 autorisiert,ohne es auf Knoten 2 zu tun
autorisiert,Daher kann die ASM-Instanz der DBCA-Konfiguration auf Knoten 1 das Raw-Gerät erfolgreich zur Datenträgergruppe hinzufügen,während in
Derselbe Vorgang auf Knoten 2 aufgrund fehlender Berechtigungen,Diskgroup DIMOUNT verursacht,führt schließlich zur Datenbank
Herunterfahren der Instanz。
Autorisieren Sie dann das nackte Gerät auf Knoten 2,Starten Sie die ASM-Instanz neu,Problem gelöst。
$ es ist –
Passwort:
Sun Microsystems Inc. SunOS 5.8 Allgemeiner Patch Oktober 2001
# Chown Orakel:oinstall/dev/rdsk/c2t500601603022E66Ad6s1
# Chown Orakel:oinstall/dev/rdsk/c2t500601603022E66Ad6s3
# Chown Orakel:oinstall/dev/rdsk/c2t500601603022E66Ad6s4
# Chown Orakel:oinstall/dev/rdsk/c2t500601603022E66Ad6s5
# Chown Orakel:oinstall/dev/rdsk/c2t500601603022E66Ad6s6
# Chown Orakel:oinstall/dev/rdsk/c2t500601603022E66Ad6s7
# Chown Orakel:oinstall/dev/rdsk/c2t500601603022E66Ad7s1
# Chown Orakel:oinstall/dev/rdsk/c2t500601603022E66Ad7s3
# Chown Orakel:oinstall/dev/rdsk/c2t500601603022E66Ad7s4
# Chown Orakel:oinstall/dev/rdsk/c2t500601603022E66Ad7s5
# Chown Orakel:oinstall/dev/rdsk/c2t500601603022E66Ad7s6
# Chown Orakel:oinstall/dev/rdsk/c2t500601603022E66Ad7s7
$ sqlplus “/ assysdba”
SQL> stilllegen
JETZT-01507: Datenbank nicht geladen
Die ORACLE-Instanz wurde heruntergefahren。
$ srvctl stop asm -nracnode2
$ srvctl start asm -nracnode2
$ sqlplus “/ assysdba”
mit Leerlauf verbunden。
SQL> Anlaufen
Die ORACLE-Instanz wurde gestartet。
Globaler Bereich des Gesamtsystems 2147483648 Bytes
Feste Größe 2030296 Bytes
Variable Größe 469763368 Bytes
Datenbankpuffer 1660944384 Bytes
Puffer wiederholen 14745600 Bytes
Datenbank geladen。
Datenbank ist geöffnet。
Eine einfache FrageGroße Schwierigkeiten。Diese Lektion zeigt, dass wir beim Lösen von Problemen ruhig analysieren und urteilen müssen,
Andernfalls ist es leicht, durch andere Informationen gestört zu werden und in die Irre zu gehen,führt zu Umwegen bei der Problemlösung。
besonders,Wenn Sie dabei sind, in die Irre zu gehen,Es wurde eine destruktive oder irreversible Aktion durchgeführt,Betrieb und Instandhaltung
Unfall。Daran kann man es erkennen,DBA in Diagnose、Bei der Analyse und Bearbeitung von Problemen,Wie wichtig es ist, einen klaren und ruhigen Geist zu bewahren。
Teilen Sie Ermutigung mit DBA-Freunden。
Original: https://blog.csdn.net/qq_34556414/article/details/80844431