数据库版本:19.6
操作系统:aix 7100-00-02-1041(这个版本低于官方的建议,至少7105)
打完补丁后手动reboot两个节点进行了重启测试均正常,由于心跳异常导致1节点重启,节点无法加入集群,查看日志卡在gipcd位置,ora.gipcd状态为offline。gipcd.trc如下:
2020-04-20 23:20:13.405 : GIPCD:1: gipcd_CLSDMInit: clsdm inited
2020-04-20 23:20:13.405 : GIPCLIB:1: gipclibGetClusterGuid: retrieved cluster guid eef49bef2b357f91bf96615856fb6788
2020-04-20 23:20:13.405 : GIPCLIB:1: gipclibGetClusterGuid: retrieved cluster guid eef49bef2b357f91bf96615856fb6788
2020-04-20 23:20:13.406 :GIPCDCLT:1: gipcdMain: acquired exclusive lock on existing map smem://wcdb1_gipcd1318_eef49bef2b357f91bf96615856fb6788
2020-04-20 23:20:13.406 :GIPCDCLT:1: gipcdMain: It is fresh start, creating brand new shared memory
2020-04-20 23:20:13.406 :GIPCXCPT:1: gipcmodSharedSegCreate: failed create smem 111b44030 [00000000000003e5] { gipcMemory : name 'smem://wddb1_gipcd1318_eef49bef2b357f91bf96615856fb6788', len 0, objFlags 0x0 }, name 'wddb1_gipcd1318_eef49bef2b357f91bf96615856fb6788-0000000000', len 10485976
2020-04-20 23:20:13.406 :GIPCXCPT:1: gipcmodSharedSegCreate: slos op : sgipcCreateSharedMemory
2020-04-20 23:20:13.406 :GIPCXCPT:1: gipcmodSharedSegCreate: slos dep : Permission denied (13)
2020-04-20 23:20:13.406 :GIPCXCPT:1: gipcmodSharedSegCreate: slos loc : unlink
2020-04-20 23:20:13.406 :GIPCXCPT:1: gipcmodSharedSegCreate: slos info: failed to cleanup map permission on map = %lo (octal)
2020-04-20 23:20:13.406 :GIPCDCLT:1: gipcdMain: Failed to create new gipcMemory() 1
2020-04-20 23:20:13.406 : GIPCD:1286: gipcd_CheckCB: GIPC Daemon is NOT yet READY for business ...
2020-04-20 23:20:13.407 : GIPCD:1: gipcdMain: All threads terminated
2020-04-20 23:20:13.407 : GIPCD:1: gipcdMain: GIPCD terminated
根据mos:GIPCD Fails to Start in 12.1 Oracle Clusterware (Doc ID 2123578.1)启出异常可能与/etc/oracle/maps权限有关。但日狗的是:权限与官方提供的不一致,但集群成员的两个目录是一致的。。。导致在权限问题上没有留意,中间折腾了很久。。。
最终的结果还是权限问题,需要修改/etc/oracle/maps为 1775。linux平台下该权限默认为1777。
还有一个做法就是deconfig节点,但找不到这个原因至少要做两次。。。