RAC中一節點沒法啓動解決步驟

問題現象:一套兩節點的RAC集羣,其中節點2集羣沒法啓動,ohas進程已經啓動但CRSCSS進程未啓動css

1、首先查看node

查看RAC中的alert日誌,發現日誌中一直在報以下報錯:oracle

file rotation terminated. log file: "/app/11.2.0.4/grid/log/uatdb02/client/olsnodes.log"app

1.png

從日誌中能夠看到提示說olsnodes.l03owner不是oracleide

查看後發現確實用戶屬主有屬組有問題spa

2.png

修改文件屬主和屬組3d

chown root:root olsnodes.l03日誌

修改後olsnodes.log能夠被正常切割,alert日誌也再也不報這個錯。但報錯也就中止。沒有日誌如何繼續往下查?blog

2、檢查RAC的一些配置狀況,因爲對於RAC也只限於可以根據文檔搭建成功,沒有太多問題處理經驗只能一邊查問題一邊查文檔和MOS進程

先檢查RACASM配置狀況

3.png

發現與以往搭建的RAC查看disk path輸出的內容不一樣,因而想到是使用asmlib搭建的RAC

rpm -qa |grpe asm發現確實安裝了相關包,說明推測方向正確

4.png

之前都是經過UDEV的方式配置RAC的ASM共享磁盤,asmlib的方式沒有用過。因而從網上找了相關的帖子查看,並找到一些命令。

oracleasm scandisks

oracleasm listdisks

可是知道這些命令仍是沒有辦法解決問題。

嘗試執行上面的命令看看輸出結果

發如今scandisks時出現permission denied on OCR1的提示

因而感受有了一個方向,是否是共享盤的權限訪問致使的呢

找到共享盤的目錄/dev/oracleasm/disks查看

5.png

節點2屬主和屬組都是root,若是是權限有問題,那正確的權限有又該是什麼呢,好在節點1還在正常的跑着,查看節點1 的共享磁盤

6.png

從上面的查看來看,正常結點的屬主爲grid,屬組爲asmadmin,是否是因爲這個緣由致使集羣沒法啓動的呢?

嘗試手動修改節點2的屬主和屬組

7.png

這裏漏掉了對權限作修改。。。

修改後嘗試重啓節點2的集羣

crsctl start crs

報錯提示ohas已啓動,crs啓動失敗

仔細閱讀crsctl start使用說明才發現start crs是啓動OHAS的命令,start cluster 纔是啓動CRS的命令。看來仍是對RAC的瞭解不夠深刻呀。。。

8.png

再次嘗試啓動節點2集羣

9.png

提示cssd啓動失敗,從alert日誌中也能夠看到以下報錯

10.png

因而查看ocss.log

11.png

ocss日誌中輸出的報錯能夠看出來是沒法找到vote disk,集羣天然是沒法啓動的。

可是爲何找不到磁盤,緣由還不知道。因而救助於MOS,但查了十幾篇有相關關鍵字的文檔,與這裏的問題又不太類似。也沒有可用的解決辦法。

因而問題限入了僵局。

下班時間到了,次日接着搞。

次日登陸機器再次嘗試crsctl start cluster(明知沒有,但仍是想試一下,僥倖心理。。)

果真沒有辜負我,依然報錯找不到vote disk

MOS文檔查到一些相關命令

crsctl query css votedisk

在節點2中無輸出內容,節點1有。

kfod status=TRUE asm_diskstring='/dev/oracleasm/disks/*' disks=ALL

節點1很快能返回

12.png

但節點2hang

13.png

並且能夠看到節點2的共享盤,權限又變回root了,因而又再次手動修改,(心想也不能每次重啓機器都手動修改這個吧)

14.png

再次執行上面的命令

15.png

出現有報錯。

忽然想到是否是兩個節點的asmlib的配置不一樣致使的,因爲對asmlib不熟悉,從網上帖子上看到的都是配置asmlib的,不知道如何查看配置

嘗試執行oracleasm configure,發現兩個節點的配置確認不一致

16.png

17.png

ORACLEASM_UID GID配置有問題

因而進行修改

18.png

查看狀態

19.png

修改完成,在scandisks時沒有提示permission denied,感受應該沒有問題了

再次嘗試啓動crs

crsctl start cluster

啓動成功

20.png

21.png

至此集羣問題解決。但從狀態來看這套RAC集羣仍是存在不少的問題。

總結:加深對RAC的理解,各組件的做用。各命令的含義。

相關文章
相關標籤/搜索