萧田国-天灾还是人祸-Oracle连环严重故障及引发的思考

龙尔丝

2018/05/13 发布于 技术 分类

来自触控科技运维总监萧田国就《天灾还是人祸?Oracle连环严重故障及引发的思考》进行了主题演讲。萧田国对于自己接手Oracle数据库之后发生的连环故障进行了分析,并与现场参会者进行了互动讨论。

文字内容
1. 天灾还是人祸?   Oracle连环严重故障及引发的思考 触控科技 萧田国
2. 个人&公司介绍   萧田国    触控科技运维总监                                  ACMUG核心成员                                          InfoQ专栏作者【高效运维最佳实践】     70%
3. 高效运维最佳实践  InfoQ官网数据  
4. 分享内容   1、数据块损坏   2、服务器假死   3、数据库无法关闭   4、更换硬件导致   5、天灾还是人祸?  
5. 背景是这样的  
6. 报表      1:数据块损坏(A)      2:服务器假死(B)      3:数据库无法关闭(C)      4:更换硬件导致(D)  
7. 1、数据块损坏(服务器A)   负载正常、硬盘正常  
8. 解决过程   •  event  10231   •  dbms_repair   •  bbed   •  analyze   •  真正原因?   •  最后的解决  
9. 2、服务器假死(服务器B)  
10. 解决方法   Ø _allow_resetlogs_corruption   Ø alter  session  set  events  'IMMEDIATE   trace  name  ADJUST_SCN  level  1'    
11. 3、数据库无法正常关闭(服务器C)  
12. 解决方法   Ø ps  -ef    grep  dbrw   Ø iostat     Ø strace    
13. 4、更换硬件导致(服务器D)   •  H310  &  H710P  
14. 解决方法  
15. 智性?  
16. 5、天灾还是人祸?(服务器A)   •  无法归档模式   •  无法RMAN   •  无法DG   •  没法expdp   •  processes        &          sessions   •  ETL数据回溯  
17. 联系我:微信号  xiaotianguo,或扫码