语雀是蚂蚁集团旗下的在线文档编辑和协作工具。这家名不见经传的厂商的产品最近因为一场意外事故而成为人们关注的焦点。
10月23日,有网友发现语雀突然死机。一时之间,网上文档、客户端、官网都打不开。更令人惊讶的是,这次故障持续了7个多小时,直到23日晚上10点左右才恢复正常。
图片
作为大厂的产品,语雀的故障修复时间如此之长,这不禁让人好奇其中的原因以及后续的修复方案。昨晚9点左右,语雀团队发文对事件进行了全面梳理。
图片
1、故障根本原因:新运维升级工具中的BUG
官方解释称,故障原因是“事发当天下午,服务语雀数据存储运维团队在进行升级操作时,由于新运维升级工具存在bug,华东地区生产环境存储服务器意外离线。 ”
受其影响,语雀数据服务出现严重故障,造成大范围服务中断。尽管尽一切努力修复问题,但“受限于恢复计划、数据大小等因素,总体时间花费了较长时间”。
语雀团队表示,通过这次失败,他们深刻认识到,“语雀作为服务千万级客户的文档产品,应该做到更好的技术风险防护和高可用架构设计,特别是对于技术变更操作。可监控、可灰度、可回滚的系统化建设和流程审核。”
为了避免重蹈覆辙,语雀团队制定了以下措施:
1.升级硬件版本和型号,实现离线后快速上线。该措施已在本次故障修复中完成;
2、运维团队加强运维工具的质量保证和测试,防止此类运维Bug再次发生;
3、减少运维动作的灰度范围,增加灰度时间,提前发现bug;
4、从架构和高可用的角度完善服务,增加语雀存储系统的远程容灾。
不过,也有网友对此回应表示不满:“首先,语雀团队好像还没做好商业化的准备,就已经商业化了。然后,没有售后团队,电话也联系不上人。而且,远程灾难我以前没有是难以想象的,最后我们也能看到雨雀团队的随意性。”
2、补偿方案:个人用户免费6个月会员服务
为了道歉并重新获得用户的信任,语雀团队在审核事件的同时,还针对两类用户提供了补偿方案。
对于语雀个人用户,我们提供6个月的会员服务。操作流程:进入工作台“账户设置”,点击左侧“会员信息”,在会员信息页面点击“立即领取”即可获取礼品服务。
对于语雀空间的用户,由于情况复杂,我们将制定单独的补偿方案。请空间管理员关注语雀站留言。
3、语雀的坎坷:前端大佬带头立项,经历两次生死危机
与钉钉、飞书不同,语雀虽然也是文档产品,但它强调“知识管理”,采用“结构化知识库管理”,形式上类似于图书目录。
正是因为这个特点,语雀上的每一篇文档都必须属于某个知识库,才能帮助用户建立知识管理的意识和习惯。但这也注定了语雀的受众面狭窄。毕竟有知识管理需求的用户还比较少,甚至培养转化也需要很长时间。
语雀创始人宇波是业界知名的前端技术领军人物。 2008年加入淘宝后,宇博先后创建了前端领域流行的SeaJS和KISSY框架,随后带领团队通过开源打造了许多技术产品。
2016年,在创新产品孵化机制中,以语波团队为首的语雀横空出世; 2018年,语雀正式向公网提供服务; 2021年,蚂蚁成立,语雀作为重点产品独立BU运营; 2022年、2019年,语雀正式推出移动版,移动iOS版同步上线。
然而,语雀的成长之路并不一帆风顺。相反,她经历了两次生死境遇。
第一次考验发生在2018年,当时文档类产品迎来爆发期。腾讯文档、飞书相继登场。想要抓住机会的阿里巴巴也推出了钉钉文档,语雀团队将其三分之二的人员转移到了钉钉上。团队成员的突然减少,让语雀的未来充满了不确定性。
第二次发生在2020年,集团集中火力,想合并语雀、钉钉文档等内部文档团队,成立独立的文档部门,以形成合力。但内部意见不统一,就放弃了。
经历了两次生死关头,语雀依然没能走上顺利的发展道路,商业化成为越来越大的压力。 2019年,语雀开始尝试简单的商业模式。但对于小团队来说,探索商业化路径并不容易。前文提到,语雀的受众目标比较分散,因此很难第一时间发现,也需要时间去转化。此前曾有媒体报道,语雀内部主要服务于蚂蚁和阿里巴巴,商业化较为单一。
更致命的是,今年4月,语雀创始人宇波从蚂蚁辞职。对于大公司内部孵化的创新项目来说,创始人的离开必然会带来一定的动荡,对人员构成和资源投入都会产生不同程度的影响。因此,当时有人猜测,随着玉叔的离开,玉雀可能会变冷。在这次紧急情况下,雨雀昏倒了7个多小时,远远超过了预计的恢复时间,这或许就反映出了问题所在。
另外,这次语雀的失败也不得不让人思考,如果飞书或者钉钉失败了,你还能正常开展手头的工作吗?你的公司还能正常运营吗?
参考链接:
鱼云专注于提供高性能云服务器和物理服务器租赁服务。我们致力于为企业提供安全、稳定、高效的解决方案,确保数据无忧、业务顺畅。