场景
定时任务拉取数据。 到月底的时候一看,半个月没跑了,很好,这半个月的数据手动补回来吧。
解决方案
可能的原因不只一种。
代码中有错误数据
定时任务一般用于批量跑数据。 如果有一条数据有问题,例如金额是 abc1324,解析为数字的时候报错。 那么每次执行这个都报错。
解决方案
1、修改数据为正确数据。
2、增加容错性, 例如try catch加在for循环的单条记录里。 这样一条错误,不会影响其他。
请求超时
这个问题原因也很多,如果请求超时了。 定时任务会一直等在这里。后续的定时任务肯定没法执行。
解决方案
设置超时时间 和 自动释放时间。
定时任务重复,造成超时或死锁
加redis锁即可。
加定时任务监控(反馈)
以上总结了些常见原因,但是肯定不全,还是很被动。 还有一种可行的方式就是加监控。
例如对每个定时任务,每天的运行情况做个汇总,发送到邮箱。