Wende:RAC-Fehler durch falsches Hinzufügen der Festplatte

Vor kurzem hängt eine Produktionsbibliothek

Der Grund für das Hängenbleiben der Datenbank liegt darin, dass alle Festplatten, die dem Dateisystem der Datenbank entsprechen, verloren gegangen sind.,Aber sehen Sie sich das Hintergrundprotokoll an

JETZT-00204dieser Fehler,Oder Baidu warf einen Blick darauf und sah den Artikel von Elder Yang,Also Einkommen für meinen eigenen Blog,

Bei den folgenden Fehlern führte das unsachgemäße Hinzufügen von Datenträgern unter RAC dazu, dass die Datenbank abstürzte。

Dies ist ein echter Wartungsprozess für eine Produktionsumgebung,Aufgrund von Platzmangel in der RAC-Testumgebung,Planen Sie daher ein

ASM-Erweiterungsraum,Beim Hinzufügen von neuem Speicherplatz zu ASM ist jedoch ein Fehler aufgetreten,Es gibt viele solcher Probleme

Die Produktionsumgebung des Benutzers kann ebenfalls auftreten。

Die Arbeitsschritte der Raumerweiterung sind wie folgt:

Das DBCA-Tool auf Knoten 1 der RAC-Umgebung gestartet, um das ASM-Gerät zu verwalten;

Weil das neu hinzugefügte Raw-Gerät in der grafischen Oberfläche von ASM nicht zu sehen ist;

Der Root-Benutzer gewährt dem Oracle-Benutzer auf dem Betriebssystem Zugriff auf das Raw-Gerät;

zu dieser Zeit,Diese Rohgeräte sind bereits von den Kandidatenfestplatten in der grafischen Oberfläche zu sehen;

Das Raw-Gerät wurde über die grafische Benutzeroberfläche zur Datenträgergruppe hinzugefügt。

 

Aber diese Operation wirft zwei Fehler:ORA-15032 bzw. ORA-15075。

 

Sehen Sie sich zunächst an, wie diese beiden Fehler in der offiziellen Dokumentation von Oracle beschrieben werden:

ORA-15032: nicht alle Umbauten durchgeführt

Ursache: Mindestens eine ALTER DISKGROUP-Aktion ist fehlgeschlagen.

Handlung: Überprüfen Sie die anderen zusammen mit ausgegebenen Nachrichten dieser zusammenfassende Fehler.

ORA-15075: Scheibe(s) sind nicht clusterweit sichtbar

Ursache: Ein Befehl ALTER DISKGROUP ADD DISK hat eine Festplatte angegeben, die dies könnte

nicht von einem oder mehreren Knoten in einer RAC-Cluster-Konfiguration erkannt werden.

Handlung: Ermitteln Sie anhand von GV$OSM_DISK, welche Festplatten das Problem verursachen

feste Ansicht. Überprüfen Sie die Betriebssystemberechtigungen für das Gerät und den Speicher

Subsystemkonfiguration auf jedem Knoten in einem RAC-Cluster, der die Festplatte nicht identifizieren kann.

 

Tatsächlich sind die Informationen im ORA-15075-Fehler offensichtlich genug。Laut dieser Fehleranalyse sollte sich das schnell finden lassen

Ursache des Problems。Sondern wegen anderer Unfälle,Die Richtung zur Lösung des Problems ist abgewichen。

 

Dieser Fehler verursachte das seltsame Verhalten:Nach falschen Angaben zu urteilen,Vorgang ist fehlgeschlagen,Aber die Inspektion ergab, dass diese nackten Geräte

Bereits sichtbar in der ASM-Konfiguration von DBCA。

 

Während der Suche nach diesen beiden Fehlermeldungen,Ein Kollege sagte mir, dass die Instanz auf Knoten 2 nicht verbunden werden konnte。

 

Durch die Betriebssystembefehlsprüfung wird festgestellt, dass die Datenbankinstanz 2 heruntergefahren wurde,Die ASM-Instanz auf diesem Knoten ist jedoch noch vorhanden。

Das Seltsame an diesem Phänomen ist das:Fehler, die durch Operationen auf ASM verursacht werden,Die aktuelle ASM-Instanz weist keine Fehler auf,aber es gibt noch einen

Eine Datenbankinstanz wird heruntergefahren。

 

Überprüfen Sie die Warndatei wie folgt,Die auffällige Informationsanzeige ist ein Kontrolldatei-Zugriffsfehler:

$ Schwanz -500 Alarm*

Liste der Knoten:

……

Du Mar 29 17:25:36 2007

ERFOLG: Festplatte DISK_0017(17.4042303525) zur Diskgruppe DISK hinzugefügt

ERFOLG: Festplatte DISK_0018(18.4042303520) zur Diskgruppe DISK hinzugefügt

ERFOLG: Festplatte DISK_0019(19.4042303521) zur Diskgruppe DISK hinzugefügt

ERFOLG: Festplatte DISK_0020(20.4042303522) zur Diskgruppe DISK hinzugefügt

ERFOLG: Festplatte DISK_0021(21.4042303523) zur Diskgruppe DISK hinzugefügt

ERFOLG: Festplatte DISK_0022(22.4042303524) zur Diskgruppe DISK hinzugefügt

Du Mar 29 17:29:45 2007

ERFOLG: Datenträgergruppe DISK wurde getrennt

ERFOLG: Datenträgergruppe DISK wurde getrennt

Du Mar 29 17:29:46 2007

Fehler in der Datei /data/oracle/admin/testrac/bdump/testrac2_lmon_2789.trc:

JETZT-00202: Steuerdatei:’+DISK/testrac/control01.ctl’

ORA-15078: Die Bereitstellung der ASM-Datenträgergruppe wurde erzwungen

Du Mar 29 17:29:46 2007

LMON: Instanz wird aufgrund eines Fehlers beendet 204

Du Mar 29 17:29:46 2007

Fehler in der Datei /data/oracle/admin/testrac/bdump/testrac2_pmon_2754.trc:

JETZT-00204: Fehler beim Lesen(Block , # Blöcke ) der Steuerdatei

Du Mar 29 17:29:46 2007

Der Systemstatusauszug wird für die lokale Instanz erstellt

Du Mar 29 17:29:46 2007

Fehler in der Datei /data/oracle/admin/testrac/bdump/testrac2_lms1_2797.trc:

JETZT-00204: Fehler beim Lesen(Block , # Blöcke ) der Steuerdatei

Du Mar 29 17:29:46 2007

Fehler in der Datei /data/oracle/admin/testrac/bdump/testrac2_lms0_2793.trc:

JETZT-00204: Fehler beim Lesen(Block , # Blöcke ) der Steuerdatei

Systemstatus wurde in die Ablaufverfolgungsdatei /data/oracle/admin/testrac/bdump/ ausgegeben

testrac2_diag_2756.trc

Du Mar 29 17:29:47 2007

Fehler in der Datei /data/oracle/admin/testrac/bdump/testrac2_j001_677.trc:

JETZT-00204: Fehler beim Lesen der Steuerdatei(Stück , # Stück )

Du Mar 29 17:29:47 2007

Fehler in der Datei /data/oracle/admin/testrac/bdump/testrac2_j000_3675.trc:

JETZT-00204: Fehler beim Lesen der Steuerdatei(Stück , # Stück )

Du Mar 29 17:29:47 2007

Fehler in der Datei /data/oracle/admin/testrac/bdump/testrac2_rbal_2982.trc:

JETZT-00204: Fehler beim Lesen(Block , # Blöcke ) der Steuerdatei

Du Mar 29 17:29:52 2007

Instanz von LMON beendet, pid = 2789

 

versuchen Sie, das System neu zu starten,Sehen Sie, welche Art von Fehlermeldung generiert wird,Die Display-Informationen, die ich dieses Mal sah, entpuppten sich als Fehler beim Lesen der Parameterdatei:

$ sqlplus “/ als sysdba”

mit Leerlauf verbunden。

SQL> Anlaufen

JETZT-01078: Fehler bei der Verarbeitung von Systemparametern

JETZT-01565: Fehler beim Identifizieren der Datei „+DISK/testrac/spfiletestrac.ora’

ORA-17503: kfdopn:2Datei +DISK/testrac/spfiletestrac.ora konnte nicht geöffnet werden

ORA-15077: konnte keine ASM-Instanz finden, die eine erforderliche Datenträgergruppe bedient

SQL> stilllegen

JETZT-01034: ORACLE nicht verfügbar

ORA-27101: Shared-Memory-Realm existiert nicht

SVR4-Fehler: 2: Keine solche Datei oder Ordner

 

Also, was ist los? Wenn Sie das Alarmprotokoll sorgfältig Zeile für Zeile analysieren,Tatsächlich wurde zu diesem Zeitpunkt die Warndatei

enthält offensichtlich die Fehlerursache:

ERFOLG: Datenträgergruppe DISK wurde entladen

ERFOLG: Datenträgergruppe DISK wurde entladen

Du Mar 29 17:29:46 2007

Fehler in der Datei /data/oracle/admin/testrac/bdump/testrac2_lmon_2789.trc:

JETZT-00202: Steuerdatei:’+DISK/testrac/control01.ctl’

ORA-15078: Die Bereitstellung der ASM-Datenträgergruppe wurde erzwungen

Du Mar 29 17:29:46 2007

Fehler in der Datei /data/oracle/admin/testrac/bdump/testrac2_lmon_2789.trc:

JETZT-00204: Fehler beim Lesen(Block 35, # Blöcke 1) der Steuerdatei

JETZT-00202: Steuerdatei:’+DISK/testrac/control01.ctl’

ORA-15078: Die Bereitstellung der ASM-Datenträgergruppe wurde zwangsweise aufgehoben

 

Die ASM-Datenträgergruppe wurde zuerst DISMOUNT,Daher wird es später natürlich Probleme beim Zugriff auf Dateien in ASM geben,

nurWenn wir die Protokolle lesen,Aufmerksamkeit ist leicht ersichtlich、einfach zu verstehen、vertraute Attraktion,oft übersehen

das eigentliche Problem,Das ist menschliche selektive Aufmerksamkeit.

Fehler in der Datei /data/oracle/admin/testrac/bdump/testrac2_j001_677.trc:

JETZT-00204: Fehler beim Lesen der Steuerdatei(Stück , # Stück )

Du Mar 29 17:29:47 2007

Fehler in der Datei /data/oracle/admin/testrac/bdump/testrac2_j000_3675.trc:

JETZT-00204: Fehler beim Lesen der Steuerdatei(Stück , # Stück )

Du Mar 29 17:29:47 2007

Fehler in der Datei /data/oracle/admin/testrac/bdump/testrac2_rbal_2982.trc:

JETZT-00204: Fehler beim Lesen(Block , # Blöcke ) der Steuerdatei

Du Mar 29 17:29:52 2007

Instanz von LMON beendet, pid = 2789

 

Siehe diese ORA-204-Fehlermeldung,Gehen Sie davon aus, dass dies die Ursache des Problems ist。

Wenn Sie sich die nachfolgende Startfehlermeldung ansehen, können Sie das Problem tatsächlich erkennen:

ORA-15077: ASM-Instanz, die eine erforderliche Datenträgergruppe bedient, konnte nicht gefunden werden。

 

Die offizielle Dokumentation von Oracle beschreibt diesen Fehler als:

ORA-15077: ASM-Instanz, die eine erforderliche Datenträgergruppe bedient, konnte nicht gefunden werden

Ursache: Die Instanz konnte den angegebenen Vorgang nicht ausführen, weil dies möglich war

Suchen Sie keine erforderliche ASM-Instanz.

Handlung: Starten Sie eine ASM-Instanz und mounten Sie die erforderliche Datenträgergruppe.

 

Wenn Sie auf diesen Fall stoßen,Gleichzeitig stieß ich auf eine weitere Denkfalle:Ich bin gerade auf einen Fehler gestoßen,dieser Fehler

Die wichtigste Fehlermeldung ist ORA-17503: kfdopn:2 Datei +DISK/testrac/ konnte nicht geöffnet werden

spfiletestrac.ora。Ignorieren Sie also die obigen Schlüsselinformationen,Konzentrieren Sie sich stattdessen auf Fehler,und denke, dass diese Begegnung

Das Problem kann mit dem letzten Mal zusammenhängen。

 

Parameterdatei kann nicht gelesen werden,Wie es geht? Versuchen Sie zu diesem Zeitpunkt, die lokale pfile zum Starten der Datenbank zu verwenden:

SQL> Start pfile=/export/home/oracle/inittestrac2.ora

Die ORACLE-Instanz wurde gestartet。

Globaler Bereich des Gesamtsystems 2147483648 Bytes

Feste Größe 2030296 Bytes

Variable Größe 503317800 Bytes

Datenbankpuffer 1627389952 Bytes

Puffer wiederholen 14745600 Bytes

JETZT-00205: ?????????, ??????, ???????

 

Nachdem ein Fehler aufgetreten ist,wieder getäuscht,um die ORA zu überprüfen-00205Fehlermeldung。

JETZT-00205: Fehler beim Identifizieren der Steuerdatei, Weitere Informationen finden Sie im Warnprotokoll

Ursache: Das System konnte keine Steuerdatei mit dem angegebenen Namen und der angegebenen Größe finden.

Handlung: Überprüfen Sie, ob ALLE Steuerdateien online sind und ob es sich um dieselben Dateien handelt

die das System beim Kaltstart erstellt hat.

Bis festgestellt wird, dass die Steuerdatei selbst kein Problem hat – Instanz 1 wurde normal ausgeführt。Da habe ich mich selbst erkannt"sich verirren”。

 

Überprüfen Sie sorgfältig alle Fehlermeldungen und die Fehlerursache – das Hinzufügen einer Datenträgergruppe,endlich das Problem gefunden

der wahre Grund:Beim Autorisieren von Raw-Geräten,Nur auf Knoten 1 autorisiert,ohne es auf Knoten 2 zu tun

autorisiert,Daher kann die ASM-Instanz der DBCA-Konfiguration auf Knoten 1 das Raw-Gerät erfolgreich zur Datenträgergruppe hinzufügen,während in

Derselbe Vorgang auf Knoten 2 aufgrund fehlender Berechtigungen,Diskgroup DIMOUNT verursacht,führt schließlich zur Datenbank

Herunterfahren der Instanz。

 

Autorisieren Sie dann das nackte Gerät auf Knoten 2,Starten Sie die ASM-Instanz neu,Problem gelöst。

$ es ist –

Passwort:

Sun Microsystems Inc. SunOS 5.8 Allgemeiner Patch Oktober 2001

# Chown Orakel:oinstall/dev/rdsk/c2t500601603022E66Ad6s1

# Chown Orakel:oinstall/dev/rdsk/c2t500601603022E66Ad6s3

# Chown Orakel:oinstall/dev/rdsk/c2t500601603022E66Ad6s4

# Chown Orakel:oinstall/dev/rdsk/c2t500601603022E66Ad6s5

# Chown Orakel:oinstall/dev/rdsk/c2t500601603022E66Ad6s6

# Chown Orakel:oinstall/dev/rdsk/c2t500601603022E66Ad6s7

# Chown Orakel:oinstall/dev/rdsk/c2t500601603022E66Ad7s1

# Chown Orakel:oinstall/dev/rdsk/c2t500601603022E66Ad7s3

# Chown Orakel:oinstall/dev/rdsk/c2t500601603022E66Ad7s4

# Chown Orakel:oinstall/dev/rdsk/c2t500601603022E66Ad7s5

# Chown Orakel:oinstall/dev/rdsk/c2t500601603022E66Ad7s6

# Chown Orakel:oinstall/dev/rdsk/c2t500601603022E66Ad7s7

$ sqlplus “/ assysdba”

SQL> stilllegen

JETZT-01507: Datenbank nicht geladen

Die ORACLE-Instanz wurde heruntergefahren。

 

$ srvctl stop asm -nracnode2

$ srvctl start asm -nracnode2

$ sqlplus “/ assysdba”

mit Leerlauf verbunden。

SQL> Anlaufen

Die ORACLE-Instanz wurde gestartet。

Globaler Bereich des Gesamtsystems 2147483648 Bytes

Feste Größe 2030296 Bytes

Variable Größe 469763368 Bytes

Datenbankpuffer 1660944384 Bytes

Puffer wiederholen 14745600 Bytes

Datenbank geladen。

Datenbank ist geöffnet。

Eine einfache FrageGroße Schwierigkeiten。Diese Lektion zeigt, dass wir beim Lösen von Problemen ruhig analysieren und urteilen müssen,

Andernfalls ist es leicht, durch andere Informationen gestört zu werden und in die Irre zu gehen,führt zu Umwegen bei der Problemlösung。

besonders,Wenn Sie dabei sind, in die Irre zu gehen,Es wurde eine destruktive oder irreversible Aktion durchgeführt,Betrieb und Instandhaltung

Unfall。Daran kann man es erkennen,DBA in Diagnose、Bei der Analyse und Bearbeitung von Problemen,Wie wichtig es ist, einen klaren und ruhigen Geist zu bewahren。

Teilen Sie Ermutigung mit DBA-Freunden。

Original: https://blog.csdn.net/qq_34556414/article/details/80844431

Hinterlasse eine Antwort