先简单地介绍系统的环境:是运行在 HP-UX 11.31 下的10.2.0.4的一套rac
数据库Alert log中出现了“IPC Send timeout”之后,经常会伴随着ora-29740 或者 "Waiting for clusterware split-brain resolution"等,数据库实例会因此异常终止或者被驱逐出集群。
在MOS上我查找了相关 IPC Send timeout 的介绍Top 5 issues for Instance Eviction (Doc ID 1374110.1)
查找到贴近我的数据库中alert.log中的报错是
Bug 6200820 : IPC SEND TIMEOUT DETECTED ERRORS BETWEEN QMNC PROCS AFTER RAC RECONFIGURATION
判断 IPC Send timeout 产生后从以下几个方面:
a) Network Problems.
b) Resource Starvation (CPU, I/O, etc…)
c) Severe Contention in Database.
d) An Oracle bug.