Costco加油站大当机

周五了,想趁着提前离开办公室的机会去Costco加汽油。要知道如果按照一周最后的工作日正常时间下班,加油站肯定要排起长龙。今天提早了几个小时,等待加油肯定不会浪费太多的时间。

错了!

排队的人虽然不是很多。但是就在我停到加油箱前面的时候。一名Costco员工跟我说:“整个系统出故障了;全国都瘫了。要等系统重启。”

不会吧?还会出这样的事情?

旁边一起等待加油的大姐凑过来问我们这边的情况。我把我听到的消息告诉她。她说她车一点油都没有了,看来只能等了。

在这个时候,我其实更关心的是Costco加油站用的什么系统?

我不知道通知我的工作人员是什么职位,对系统了解多少。我不可能在短时间查看是否其他州市的Costco也出现了同样的情况。所以姑且相信他说的全部都是事实;全美国的Costco加油站在山地地区下午3点的时候全部瘫痪,等待重启。

那么说全国的系统都是连到同一个后端平台的吗?我知道加油站肯定不是什么去中心化的系统,但是连区域都不分吗?直接连到单一的大型机上……单点故障!

这么大的一个公司会出现这种低级的设计问题吗?

不可思议……

估计平台端口不需要太多的数据传输吧?不过这样当机断掉全国加邮箱的事故影响也太大了一点。即便把数据库,后端平台都放在亚马逊AWS上面,就是当机,负载均衡也能保持不同的区域服务器迅速帮忙解决一下当即地区的网络问题。

我相信设计这个系统的工程师们肯定比我这个小IT的牛,应该不会想不到……

就在这时,工作人员又过来了;通知我们重启从刚才说了要等待三分钟变成了十五分钟。

走啦,不在这等了。很明显不可能短时间恢复了。还是赶紧找其他地方加油吧。



0
0
0.000
2 comments