近期自动化待搞项目

近期希望对公司现有运维架构做个调整, 新的架构是希望在支持未来3-5年的公司发展迭代时,能完美的支持,不再做大的调整。

以下会列出规划,至于实现我会另写博客,每完成一个会附上一个解决方案的链接:

监控

1.监控告警图表化

需求:单纯的文字告警有时太过于简陋,无法看到监控项的线性增长量,希望在告警的时候能附上过去一小时的监控图表

环境:zabbix3 + 钉钉

解决方案:https://github.com/ChampagneCui/zabbix_alert

2.zabbix现状告警统计

需求:上面的告警是一条一条的,但是有时候一晚上睡醒,发现有10个告警,8个恢复,我们不可能去一一对应,我们只希望知道当前还有哪些没恢复

解决方案:https://github.com/ChampagneCui/op_script/blob/master/zabbix/zabbix_monitor.py

3.zabbix 监控项自动发现与trapper收集方式

需求:

解决方案:

4.阿里云监控项对接zabbix

需求:

解决方案:

5.监控图表grafana批量添加

需求:

解决方案:

6.日志收集与监控告警

需求:

解决方案:

7.日志自助拉取平台

需求:线上大多数日志都已经收集进了ELK中,然鹅还是有一部分日志由于格式不对是无法录入ELK的,这些日志开发在排错时候也需要,目前的方案是开发通知运维,由运维拉去后传给开发,这种方案及其低效,运维希望写个平台让开发自助完成这样的事

解决方案:

8.监控自动化生成周报

需求:

解决方案:

9.阿里云RDS(mysql)慢日志拉取并邮件发送

需求:

解决方案:

10.业务监控

需求:模拟用户登陆业务,操作业务,返回结果,保证线上核心业务流程无故障

解决方案:

 

发布

1.一键批量发布代码

需求:一键批量发布所有项目,无需jenkins一个个点,且结果也汇聚在一起显示

解决方案:

2.各发布环境的分支及发布日期显示

需求:同一在一个地方显示所有项目所有环境的目前发到哪个分支及发布日期

解决方案:

3.一键批量修改apollo

需求:

解决方案:

4.一键批量添加mq

需求:包括virtualhost,exchange,queue

解决方案:

5.线上批量操作ansible管理

需求:

解决方案:

6.All in Jira

需求:以上的发布代码、新增mq、apollo配置都在Jira完成,使得Jira类似于阿里的A1

解决方案:

7.线上无感发布

需求:

环境:阿里云slb+Eureka+java

解决方案:

 

CMDB

 

发表评论

电子邮件地址不会被公开。 必填项已用*标注

This blog is kept spam free by WP-SpamFree.