http://www.ox-holdings.com

了解一下过去那几年我们所经历过的各种不可抗离奇事件吧新匍京娱乐场官方下载,了解一下过去那几年我们所经历

摘要这是微信继今年四月、七月后,又一次大范围失灵。前两次事后解释的原因,一次是机房交换机出硬件故障,一次是路段施工导致光缆被挖断。这次不知道事后总结会是什么。在上次出现大规模故障后,马化腾已正告微信要加强 ...8月19日即时通讯/IM产品“易信”发布。嗖嗖地已目前已上了App Store前三名。微信为表示对友军的庆贺,英勇地于当日晚上10点左右挂掉。公众平台、朋友圈、游戏等链条环节,一一崩溃,无法连接。以上一半玩笑。真实的另一半是:微信真的又出大规模故障了。微信团队在新浪微博的告示如下:这是微信继今年四月、七月后,又一次大范围失灵。前两次事后解释的原因,一次是机房交换机出硬件故障,一次是路段施工导致光缆被挖断。这次不知道事后总结会是什么。在上次出现大规模故障后,马化腾已正告微信要加强容灾处理能力建设。这次“出错”的时机出现得太有趣了。欢迎明天阴谋论者们踊跃登场。

7.2.我司被殃及

 

从2014年1月17日下午18点开始,互某通IDC机房由于托管用户触某科技被 DDoS 攻击造成大网受到影响,网络断断续续。

故障现象为:机房内到外 PING 丢包严重,丢包最严重时丢包率 100%;网站无法正常访问。

这种现象在1月18、19、20日仍继续发生,IDC机房采取的措施是,一旦发现触某科技被打,就关闭它的端口,保证其他公司业务不受影响,所以每次都是几分钟的波动。

 

 

假如条件答应,可以添加UPS(不间断电源)来保证交换机的正常供电,有的UPS提供稳压功能,而有的没有,选择时要注重。在机房内设置专业的避雷措施,来避免雷电对交换机的伤害。现在有很多做避雷工程的专业公司,实施网络布线时可以考虑。

家住北京的支付宝用户李木水27日傍晚正在给朋友转账,提交转账支付密码之后,支付宝钱包界面上并没有看到刚才转账的对话记录,是否成功也没有提示。再刷新一遍,连早就设置过的头像也提示他重新设置。见此情景,李木水说:我一下子心慌了。

3.2.自身的硬件问题

 

2014年10月27日,

  1. 15:20分,监控报警发现网站销量异常以及网站无法正常打开。

2. 15:23分,运维部开始分配工作检查故障,排除公司网络、DNS解析、外部网络攻击、机房网络问题等环节,最后判断是网站外网核心交换机可能出现故障。

  1. 15:47分,运维部工程师从公司出发到机房现场进行问题排查。

4. 16:05分,运维部工程师到达现场,使用笔记本接入核心交换机,查看交换机工作状态,发现有大量报错,经判断为核心交换机堆叠出线故障,造成交换机无法正常工作。工程师将交换机堆叠线缆重新安装,并重启交换机 。

  1. 16:15分,核心交换机完成重启,故障报错消失,网站开始恢复提供访问。

 

7.3.自摆乌龙

 

高估了我司的服务性能,无线曾经发了一次批量 Push,结果用户蜂拥而来,洪水而来的请求直接打垮了无线服务器协议端,各个节点雪崩。无线大头欲哭无泪。

还有一次,2012年4月24日,有人发微博说专卖店页面访问 504(Gateway Timeout),还有微博说我司商品图片打不开了。

经查,是无线在公司内网的服务器在上午9点~12点之间,从CDN大量抓取我司商品图片。

由于抓取的大量图片(毕竟是遍历商品嘛)在 CDN 中没有缓存,导致 CDN 回源取数据的流量增加,变相形成 CDN 服务器轻量 DDoS 我司静态资源服务器的情况 。

只好告诉大家在对自家主站数据进行任何大规模(并发)抓取前,先想想后果,不要自己 DDoS 自己。

 

小结一下,写了这么多,就是让大家了解一下线上线下都会面对哪些不可抗因素,做好心理准备。

 

-THE END-

 

欢迎您关注微博@郑昀,欢迎您关注微信订阅号『老兵笔记』。

 

赠图一枚:

新匍京娱乐场官方下载 1

相关精彩文章:

技术高手如何炼成

挖坑和踩雷

小伙伴们手滑集

被小伙伴们吓哭了:可怕的命令

5·12和6·17两知名网站域名被劫持事件实施过程回放

解决方法:在外部电源正常供电的情况下,假如交换机的各个内部模块都不能正常工作,那就可能是背板坏了,碰到这种情况即使是电器维修工程师,恐怕也无计可施,惟一的办法就是更换背板了。

以技术见长的互联网公司很少因为系统问题宕机,却多次由于硬件问题影响服务。就在支付宝挂掉的同时,网易公司也通过微博公告:由于杭州市萧山区某地光纤被挖断,造成目前少部分用户无法使用网易LOFTER,技术人员正在抢修中。据了解,2013年7月,由于上海一条光缆被挖断,导致微信在很多地区无法正常使用长达7小时。2014年10月,微信还因为上海机房出现故障,导致全国大面积故障2小时。

一.空调,挥之不去的噩梦

 

我们一而再再而三地跌倒在IDC机房空调机组脚下,那几年每年夏天都过得提心吊胆,每次望见漫天杨絮都忧心忡忡。

 

回顾一下历史:

  1. 2011年5月6日

    • 15点~18点,我司所在的世某某联廊坊IDC机房,空调故障,局部过热,导致部分主机自动关机。

    • 所幸只影响到CMS的使用,对其他服务无影响。

  2. 2011年6月2日

    • 16点~19点,仍然是世某某联廊坊IDC机房,空调机组故障,造成托管机房温度过高。

    • 16点10分开始,运维部已将中心区域服务进行了迁移,将核心业务迁移到边缘区域温度相对较低的服务器上提供服务。但随着中心区域温度的持续升高,17点开始中心区服务器相继出现工作不稳定和宕机状况。

    • 17点50分至18点06分期间,前端服务器陆续宕机,造成20%用户打不开网页。

    • 于是我司于6月底停服夜奔,从廊坊搬迁服务器回了北京,孩子还是放在身边放心。

  3. 2013年5月18日

    • 16点10分,我司所在的北京互某通IDC机房的空调机组因杨柳絮堵塞室外机而停机。

    • 托管机房某列机柜内托管服务器超温保护自动关机。

 

IDC机房空调机组停机导致的事故,我司每次都是标准处理流程:

1)运维部极速飞车到机房,冰砖啊风扇啊挪机器到外围区域啊;

2)运维部发函追责;

3)IDC机房承认错误,做出赔偿;

4)运维部发事件报告以及对方公函。

 

历史上其他公司的空调殃及池鱼事件:

2012年12月26日,12306火车票网站因机房空调系统故障而无法访问。 

 

七.DDoS

 

我司被 DDoS 攻击过,也被同机房的其他公司殃及过。

 

线缆故障

支付宝不仅是中国最大的第三方支付平台,也是中国最大的货币基金的网络入口,还是很多城市水电煤气的缴费终端。在上海一家外企工作的李楠告诉记者:已很少用现金,工资一发下来就放在余额宝里,支付宝出问题,大家都非常担心,生怕钱丢了。

5.2.流量联盟劫持域名

 

2014年1月23日,长沙城市经理反馈,在网吧上网发现我司、某800等页面均直接跳转到美某团。

运维部远程协助后发现,IE浏览器访问我司域名以及其他电商域名时,会跳转到亿某发的通过网易短网址服务缩短后的地址,

然后再跳转到 ,

最后跳转到美某团

运维部怀疑是亿某发联网旗下的站长联合网吧出口的管理软件,对团购相关网站做了域名劫持。

 

那个年代,亿某发联盟的成员在各地劫持各大电商流量,十分常见,花样百出。

 

6.1.杀毒软件拦截

 

2013年10月23日淮安城市经理反馈,商家发现用金山毒霸杀毒时会提示说我司商家后台域名有问题,如下图所示:

新匍京娱乐场官方下载 2

图4 浏览器上的杀毒软件提示

 

经过研发人员与金山客服联系,很快不再拦截,但客服拒绝回答原因。

 

接下来,我们又发现,商家在电脑桌面上创建有我司商户后台的快捷方式时,立刻弹出金山毒霸的病毒报警,如下图所示:

新匍京娱乐场官方下载 3

图6 金山毒霸的弹框提示

 

再一次联系金山客服后,金山客服反馈金山后台已经处理。

 

金山客服表示,今天处理问题与昨天处理的问题是同一个问题在两个不同软件中的体现,所以需要进行两次处理。当被问及是否还会出现第三次或者在金山的其他平台出现类似问题时,客服不确定不会出现,只能保证浏览器和快捷方式文件的病毒误报情况,不会再出现,如果有大量用户投诉网站内容,也可能会再次出现病毒报警。

 

解决方法:从上面的几种硬件故障来看,机房环境不佳极易导致各种硬件故障,所以我们在建设机房时,必须先做好防雷接地及供电电源、室内温度、室内湿度、防电磁干扰、防静电等环境的建设,为网络设备的正常工作提供良好的环境。

业内人士表示,服务中断通常会导致交易失败,资金并不会凭空消失。不过这种少见的大范围服务瘫痪仍然引起了用户担忧。支付宝方面称,对于27日晚间的故障,目前尚未接到用户由于这次故障引发的资金损失索赔。

四.波及全国的DNS根域问题

 

DNS 出了问题,谁也跑不了,都受影响。

最近一次DNS事故是,2014年1月21日,继上午腾讯16项服务出现故障(与我司有关的是QQ联合登录登不进网站了)后,下午15点10分~16点30分,全国所有通用顶级域的根出现异常,导致大量国内网民无法访问 .com 域名网站,很多网站被解析到 65.49.2.178 这一美国IP地址。由于公网访问我司以及支付宝,均需要域名解析,所以损失无法估计。

 

据报载,近年来中国大规模的网络瘫痪事故有五起,包括2006年台湾地震震断海底光缆事故、2009年暴风DNS受攻击导致大范围断网、2010年百度域名被劫持事件、2011年中国电信宽带维修导致大规模网络故障、以及2014年1月21日DNS域名根服务器故障。

 

二.易断的缆线

 

2011年11月17日16点40分~18点20分,我司短信通道所在的天津塘沽某IDC机房电缆被铲车挖断,备用电源坚持不了太久,机房断电,导致我司无法使用短信通道,同机房的遨游、新浪邮箱、豌豆荚等公司的服务也因此中断。

 

其实只要你运营时间足够长,总会撞上一次:

  • 2012年7月25日晚间~21点40分,北京暴雨抢修光纤被挖断,导致美团网一度不能访问。

  • 2012年10月18日上午~11点40分,酒仙桥某IDC机房断电,凡客诚品(刚好赶上凡客五周年生日促销)、亚马逊中国等网站无法访问。

  • 2013年7月22日上午,因市政道路施工导致通信光缆被挖断,影响了微信服务器的正常连接。

 

这是网吧交换机使用时最常见的硬件故障,小编要提醒大家:无论是光纤端口还是双绞线的RJ-45端口,在插拔接头时一定要小心。假如不小心把光纤插头弄脏,可能导致光纤端口污染而不能正常通信。我们经常看到很多人喜欢带电插拔接头,理论上讲是可以的,但是这样也无意中增加了端口的故障发生率。

据了解,除了系统级的安全提升之外,部分互联网金融企业正在试图通过给用户买资金险、账号险的方式加强安全保障,如果最终仍然发生资金损失,将通过保险理赔来保障用户权益。

郑重声明:本文版权归新匍京a奥门-最全网站手机版app官方下载所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。