仅以本文,记录工作中遇到的那些坑,要么是Bug要么是问题,以及,积累的工作思路:
--------------------------------------------------------------------------------
【事件】日志实时入库代码,过滤掉了客户端ip为127.0.0.1的量。后来发现是代表https的流量。
【结论】程序里任何一个模糊不清的细节,都会在未来某个时间点爆发,让你写故障报告!
--------------------------------------------------------------------------------
【日知】诡异现象看系统!
【事件】python脚本里调用os.system(cmd_str),发现cmd_str没有被执行,它的下一条语句却被执行了!
【结论】遇到进程没有按照代码设定的逻辑走,多半就是os资源问题,一般2种情况:1,被信号中断了;2,内存不足!
--------------------------------------------------------------------------------
【日知】第三方库会坑人!
【事件】使用公司内部评审脚本,发起评审失败,显示Patch error。原来是版本不对,旧版有坑,应该升级最新版。
【结论】用到第三方库(比如 libjson | libprotobuf | libhttp)的时候,一定要留意它的版本。要及时更新第三方工具的版本!
--------------------------------------------------------------------------------
【日知】小代码也要上库,做到有据可查!
【事件】跑在LZ系统上的SQL语句没有做版本控制,无法查看历史修改记录,无法追查责任人。
【结论】再小的代码(哪怕只有一句话),只要是在生产环境上跑着,在为客户服务着,就要上库!