2024年2月初,一个小站设置在香港阿里云的前置服务器进行了一次配置变更,其后引发了偶发性的故障,导致部分访客看到了空白页面,在此对这一故障进行复盘。
此次配置变更具体为将前置服务器的反向代理服务由Nginx Proxy Manager改为直接使用NGINX,并将反向代理由每个站点单独配置改为使用通配符。此次变更的预期结果是,通过更高效的部署降低前置服务器的内存占用,以提高网站性能;同时使用通配符简化未来新增二级域名站点时的部署操作。
我分别于17日、23日和24日收到朋友反馈,称网站的不同站点无法访问,经截图确认,是服务器返回了chat.ygxz.in更新程序前的页面,由于.js文件路径于程序更新后发生变更,因此出现了「三红点+白屏」的页面。
chat.ygxz.in在近期进行分支更改,修改了部署时拉取的镜像,该变更结束后即出现相同白屏现象,经排查应为浏览器缓存了html页面所致,因此我临时上线了askbox.ygxz.in站点进行替代。接到反馈后我曾尝试通过清除反代缓存等措施进行修复,但并未解决问题。
本次故障预计影响一个小站的博客、网盘、API商店及所有公益服务中国大陆方向的访问。
短网址服务、探针、文件存储及所有站点的海外访问均不受影响。
2月24日,对前置服务器的配置更改已经回滚,目前观察发现故障基本恢复。
在此向受影响的访客致歉。