2019年8月21日接口故障说明
大概经过
早上10点15分左右,收到几十个用户QQ和邮件告诉我,工具无法使用了。
请求淘宝开放平台接口有返回原因,就是说聚石塔的华东区要下线,不能再使用了。赶紧迁移,不然就给你限流,让你隔三岔五用不了。
于是第一次出现这个情况时,我赶紧迁移到华北3区,并关闭了华东区的服务器,不再使用。
下午2点10分左右,第二次出现这个情况。我申请了退款,他们审核通过,随后就释放掉华东区的服务器。一个都不剩,彻彻底底完成了他们要求的迁移。(PS.只有退款才能释放服务器实例)
下午3点10分左右,第三次出现限流提示。我已经没办法,只能提工单、找小二沟通,都没有效果。等到下午4点才恢复,三次持续共一个半小时。
告警通知
早上我收到聚石塔发出来的迁移提示。留意下面截图的日期,8月7日发布公告,8月13日开始“演习”,9月30日下线:
公告也是这样写的:
回想
我只有极小部分接口放在聚石塔,调用量也是很小、频率也是很低的。
举个例子,我一天调用量600万次,只有6万次是在聚石塔的。
那就是1%的比例,他们所谓的“演习”没有引起我太多关注。所以我自以为在9月30日之前迁走就没事。
而且我理解的接口限流,是接口维度,哪个接口没迁走就停哪个。
没想到是整个账号下的appkey,以及appkey下的所有接口都被限制了。
而他们在钉钉群否认是账号维度的限制,这点让我最气愤。
我放在聚石塔的appkey,跟平时淘宝业务接口的appkey都不是同一个。
有什么可能只封聚石塔的appkey,会使我所有业务都瘫痪掉?
负责聚石塔的小二已经知道我迁移完成,却没办法阻止第三次限制。
让我一度怀疑他们的限流机制是否合理,对用户是否负责?考虑是否周全?也是我写他们店大欺客的原因。
这是时间最长的一次,长达50分钟,这对我们服务商来说是很致命的。平时为了保证服务的可用性,我搞负载均衡、搞主力机备用机,这次都没办法用上,因为它是账号级别的限制。
明天还会不会继续限制?在钉钉群里提问没有得到明确的回复,6个小时前提的工单也没有人处理。
限流的意义在哪里?你们华东区服务要下线,一个月不到的时间赶着我们搬走。不然就泼油漆,还要连续泼三次。
惹不起。。惹不起。。