系统容错的想法 - 代码天地

系统容错的想法

其他 2018-05-03 15:33:27 阅读次数: 4

1.善用缓存

理财业务，对于用户的收益数据，是实时去DB中查询的, 当DB发生故障时, 如果没有备份数据源，用户将看不到收益，如果使用redis做缓存，则可以作为备用数据，展示给用户，避免用户投诉
使用redis时，如果redis也挂了，需要考虑本地是否有数据，如果业务场景允许一段时间的脏数据，可以使用本地内存或者二级cache先扛住，如果业务不同意脏数据, 那需要快速失败，就直接
告诉用户失败了，稍后再重试
通常用户看到失败后，都会不断的重试，反而给业务后台带来更大的压力，造成消息堆积雪崩，针对这种情况必须做好流量控制，快速失败的方案，前后端都可以做控制. 系统设计重点要考虑异常如何处理.

2.主动重试

建立自动重试的机制，这样可以避免频繁的人工介入，尤其是针对服务极其不稳定的合作方，更需要如此，以减少我们的工作量.

3.必须优化掉DB慢查询

慢查询非常危险，必须要确认表中有索引，如果没有，当并发超高时，将会造成DB cpu飙升，程序无法响应，用户发现请求失败后，就会继续不断的发请求上来，最后服务雪崩了.

4.引入异步处理

对于耗时很长的任务，可以拆分成异步操作，先快速的返回给上游，让上游继续做其它事情，或者上游收到响应后，尝试查询几次后，就接着继续做后面的事情。
从用户体验上比单纯的让用户一直等待好很多.

5.程序执行顺序

在异常情况下，程序的执行顺序会给系统带来问题，比如有处理重试任务的应用，如果代码设计时，是在系统重启后，马上处理失败的任务，则有可能把正常请求堵死，反而导致更多的失败发生.

6.清晰的日志

涉及到多个系统之间的调用时，需要有一个统一的字段，串联起整个交易，这样方便运维查获日志，定位问题，以及监控.

7.流量控制

8.降级开关

9.旁路

10.消息驱动的模式

猜你喜欢

转载自www.cnblogs.com/ctrlzhang/p/6201746.html

系统容错的想法

推荐系统的想法

学生系统总结（想法）

PBFT使用拜占庭容错系统

构建容错软件系统的艺术

想法

邮件系统双机容错方案

关于标签系统的一点想法

未成年防沉迷系统的想法

【操作系统】CPU管理的直观想法

同步系统和异步系统容错率的思考

实时流处理系统容错机制（二）：Apache Flink 基于State的异步容错机制

操作系统管理CPU的直观想法

[转]分布式系统的延迟和容错库Hystrix

什么是计算机系统的容错性

【转】亿级Web系统的容错性建设实践

【链块技术 02期】共识机制：拜占庭容错系统

亿级 Web 系统的容错性建设实践

linux系统学习的一些想法

基于skip-gram做推荐系统的想法

9个用于构建容错系统的开源工具

9 个用于构建容错系统的开源工具

关于系统中账号注册登录的一些想法

系统解读 Kafka 的流和表：弹性和容错能力

系统架构设计笔记（93）—— 容错技术

系统稳定性建设相关的一些想法

关于应用调用系统权限的一些想法

数据库故障容错之系统时钟故障

亿级流量系统架构之如何设计高容错分布式计算系统

Dubbo 容错

今日推荐

周排行

AIZU 2224 Save your cats(并查集)

HTTP响应头状态码详解

Python socket编程（2）

MaxCompute Studio使用心得系列7—作业对比

Supervisor安装使用

LeetCode 164. Maximum Gap

mysql面试题: 一张表里面有ID自增主键，当insert了17条记录之后，删除了第15,16,17条记录，再把mysql重启，再insert一条记录，这条记录的ID是18还是15

nutch1.2 DeleteDuplicates IndexMerger 详解

OC - @property与setter,getter方法

SpringBoot @Transactional的rollbackFor属性

每日归档

更多

2024-09-19(0)

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)