加入收藏 | 设为首页

数据库 今天你检查备份了吗?【炉石传说游戏数据库回档事件反思

来源:本站原创 发布时间:2019-07-31

  即日引爆各大手艺群的工作即是网易游戏《炉石传说》游戏数据库爆发宕机并激发数据丢出事情,最终肯定回档并后续抵偿玩家耗费。详情可见官网通告:

  我以前也正在搜狐畅游(,NASDAQ:CYOU)承当游戏数据库保卫,也碰到过由于供职器毛病最终导致回档的事情,可是都没像这回炉石搞这么大力措。正在这里我并不思借机戏弄消费他们或搞营销,只思和大师一齐聊聊行为DBA,该当幼心哪些事。

  通告密布时刻是2017.1.18 18点,肯定回档到2017.1.14 15:20,中心这段时刻莫非平昔都正在考试收复数据库,就不行速捷做出决定尽速直接回档吗,这是正在磨练游戏玩家的耐心,很容易激发玩家的“群体事项”;

  由于供电无意导致毛病,并变成数据库损坏,倘若也用MySQL数据库的话,看起来该当是没开启双1筑树,而且有大概还正在运用老式的锂电池BBU。因而断电后很容易导致阵列卡cache中的数据遗失,数据库也随着损坏,以前没少才踩这个坑;

  连备份数据库也爆发毛病,有点难以想象,云云就容易让人形成是人工事情的联思了。可是,我多年前也爆发过肖似的情景,可是那次是由于用mysqldump备份时指定了谬误的字符集,而且正在做备份收复测试时没正经测试数据的有用性,以致爆发毛病时不行寻常收复,结果也悲剧了。行为不睬解黑幕的局表人,只可能官方通告为准,无要无端臆度;

  每幼时一次增备或不同备份,我以前的做法是开binlog,而且应用last_update_time列特性每幼时做一次不同备份。云云我要收复的话,通常最多只耗费不到一个幼时的数据;

  备份文献务必举行收复测试,倘若有多个备份集,可能采用随机抽取的体例做收复测试,但肯定要保障一真实例的备份最终城市被验证一次;

  务必监控供职器硬件强健状态,搜罗CPU、内存、阵列卡、阵列卡电池等部件,以及供职器温度等。咱们也曾有正在哈尔滨及西安某机房的供职器,一到夏季就很容易由于温渡过高而激发自愿重启����咱们的治理计划即是应用监控,提前预警,趁早报告机房掀开机柜门而且布置散热,例如很low的放着电扇对供职器吹啊吹 ����

  速过年了,做运维的同窗该当也都差不多做十足服巡检了吧,先祝大师春节喜悦,鸡年祥瑞,新的一年供职器宕机率节减99%����

  为道喜中生代缔造一周年,也为了答谢历久帮帮的同伙们,中生代即将正在三月份举办北京,上海,成都三场年度大会。正在北京场的大会中,就相合于运维,数据库监控和NewSQL话题的分享,自负您肯定能从中理解到奈何避免云云的“坑”,请扫下面的二维码举行合切。


Copyright 2017-2023 http://www.91ctw.cn All Rights Reserved.