两条命令找出第三方接口问题点

缘起

这几天疲于救火,火气有点儿大,今早领导在群里@我了下,说第三方反馈我们的网络有些问题。搞得我一头雾水,我首先问清了事情的原委,原来我们这边某个应用调用了第三方接口,但是应用这边时不时的会甩出那么几条错误,而且近期比较多。这不问题一多,大家就紧张了。为了自证清白,我不得不拿起武器自卫。

措施[……]

继续阅读

ES集群7.3.2版本在线扩容Data节点

背景

接到生产业务需求,需要在线扩容ES集群且不能影响数据安全性,经过对Elasticsearch角色的分析,发现直接扩容Data节点最简单而且能满足需求。
备注:原来ES集群3节点dim角色默认都开启了。

原节点信息

[root@188_33_centos ~]# curl 192.168.[......]

继续阅读

运维的境界

引子

怎么说我也算个出道十年的运维老兵,连笔记在技术博客上也做了九年了,可是最近与一位业外人士交流时怎么都不能用大白话讲清楚运维具体是做什么的?

为此我懊恼了一小会儿,后来又反省并做了下功课发现我之所以不会用大白话不会用打比方的方式告诉业外人士运维到底是干什么的,主要原因是我没有洞察运维的本质。[……]

继续阅读

SRE生存指南Mikey金字塔

Mikey金字塔摘选自纳特·韦尔奇著作《SRE生存指南:系统中断响应与正常运行时间最大化》,译者为冯文辉。

注:这个七层金字塔围绕着沟通设计。每一层都建立在前一层的基础之上。它被沟通所包围,因为每一层都需要沟通才能成功。

SRE工程师是大厂才有的细分的一个职位,其中Mikey[……]

继续阅读