• 基于时序数据库做监控,这里有超流行的开源方案
    基于时间序列数据库的监控系统是非常适合做监控告警使用的,所以现在也比较流行这个方案,如果我们要搭建一套新的监控系统,我也建议参考这类方案进行。下面介绍几款目前业内比较流行的基于时间序列数据库的开源监控方案。Alertmanager:是用于数据的预警模块,支持通过多种方式去发送预警。
  • 微众银行对新一代银行IT架构的设计与实现
    近期收到来自微众银行的赠书《新一代银行IT架构》。作为互联网银行的代表之一,微众银行在较短时间内,构建了全新的银行IT基础架构。可以说,微众银行的实践为提升金融机构信息安全水平,做出很好的实践,值得很多同业者参考学习;甚至可说具备一定的社会效益。新一代架构,势必需要依托于分布式架构设计理念,有针对性地解决扩展性的问题。相较于传统银行,互联网银行更强调面向社会提供7X24小时不间断的银行服务,这与其服务群体、服务形式有关。概念上来说耦合性是对一个软件结构内不同模块之间互连程度的度量。
  • 微博2亿日活背后,广告系统不掉线的全景运维大法
    分享概要1、运维自动化2、弹性计算3、智能监控4、服务治理一、前言微博现在日活达到了2亿,微博广告是微博最重要且稳定的收入来源,没有之一,所以微博广告系统的稳定性是我们广告运维所有工作中的重中之重。微博广告的运维主要负责资产管理、服务稳定性维护、故障应急处理以及成本控制等多个责任。基于这些功能和需求,我们广告运维自主研发了Kunkka平台、资产管理、自动化上线等运维平台。另外,它无法准确预估容量,在传统的业务运维模式下,范冰冰分手、双宋离婚带来的流量是无法实现的,我们无法评估扩容量。
  • 荐书丨三本精选好书攻克技术管理瓶颈
    时代快速变革带来机遇与挑战,个人发展除了积累行业内的技术经验,提高管理能力更显必要。dbaplus社群携手@华章科技 @异步图书,推荐三本IT职场好书,帮助大家提升管理能力。购书链接:https://item.jd.com/12176506.html如何拿书欢迎在本文微信订阅号评论区写下#你目前在技术管理上的困扰或想法#,小编将从中选出评论点赞数最高的一位,以及评论最精彩的两位读者,送出本期推荐的好书一本,截止时间:下周四中午12:00。另外,dbaplus社群即将在9月21日举办Fintech上海沙龙,邀请到多位深耕金融科技的技术专家,一起从不同视角探讨金融级数据库与运维实践,同样不容错过。
  • DBA神级操作:如何将工作“合理分摊”给开发?
    我没有时间顾全一切我是一名非常忙的 DBA。开发人员的工作也是如此,他们需要不断地更新系统,但是相较于 DBA 的修改,比例有所不同。通常来讲,开发人员管理的代码远远多于 DBA 管理的。DBA 没有足够的时间审查所有的内容,修改的内容直接发布到生产环境,造成问题时 DBA 就不得不需查看当时的修改内容。如果 DBA 有时间的话,就应该在评审期进行检查。我发现,当开发人员和 DBA 都开始书写并分享自己的见解的时候,这种方式会更加奏效。尽管内容可能并不是很深入,但是这并不重要,因为开发人员和 DBA 在这个过程中都会学习到一些知识。
  • 在K8S上运行Kafka合适吗?会遇到哪些陷阱?
    这就是为什么我要指出Kafka和Kubernetes之间的相互补充性以及你可能遇到的陷阱。简而言之,Kafka broker会因为NFS“愚蠢重命名”问题而无法删除数据目录,自行终止。如果Kubernetes节点出现故障,那么整个Kafka集群都会出现故障。由于ZooKeeper是Kafka的一部分,因此可以通过这个了解哪些Kubernetes概念被应用在这里。精心设计的Helm Charts能简化所有参数正确配置的复杂任务,以便在Kubernetes上运行Kafka。Strimzi为Kafka提供了一个优雅的Grafana仪表板示例。因此,可以免费获得基本的Kafka集群监控!
  • 基于MySQL Binlog的Elasticsearch数据同步实践
    使用 Elasticsearch 存储业务数据可以很好的解决我们业务中的搜索需求。把需要检索的业务数据,统一放到一张MySQL 表中,这张中间表对应了业务需要的Elasticsearch 索引,每一列对应索引中的一个Mapping 字段。通过脚本以 Crontab 的方式,读取 MySQL 中间表中 UTime 大于上一次读取时间的所有数据,即该段时间内的增量,写入Elasticsearch。为了解决上述问题,我们提出了一种基于 MySQL Binlog 来进行 MySQL 数据同步到 Elasticsearch 的思路。Binlog 是 MySQL 通过 Replication 协议用来做主从数据同步的数据,所以它有我们需要写入 Elasticsearch 的数据,并符合对数据同步时效性的要求。利用 Kafka 的 Offset 机制,在确认一条 Message 数据成功写入 Elasticsearch 后,才 Commit 该条 Message 的 Offset,这样就保证了数据的完整性。
  • 去哪儿智能故障预测与应用健康管理实践
    分享概要1、OPS的目标 & 工作2、Qunar运维演进3、故障预测与健康管理简介 & 方法论4、Qunar的实践5、前景与问题大家好,我是去哪儿的运维开发张岩。今天分享的主题是“智能故障预测与应用健康管理实践”,会根据我们公司的现状、所处的环境来提出一些思考,并利用这些思考产生一些方法,以及我们基于这些方法的实践。针对故障这一部分我们OPS的目标有两个:第一,减少故障的产生;第二,快速修复这个故障。③ 健康管理这是比较长期的策略。手段和策略1)故障事后处理去哪儿网的故障事后策略做得相当不错。
个人资料

围绕Database、Bigdata、AiOps的企业级专业社群。顶级大咖、技术干货,每天精品原创文章推送,每周线上技术分享,每月线下技术沙龙,受众20W+。