apache ignite 技术目前已经发展到了v2.10.0 stb,最新beta到了v3.0.0,短短数月已经推进3.0测试了,相信不久就能使用。
今天和大家分享ignite集群技术的监控工具,任何一个分布式计算存储系统都离不开集群的监控管理工具,不然会让运维同学抓狂的。
目前ignite的metrcis数据支持JMX和OpenCensus两种数据格式,能够支持这样数据格式的监控平台理论上都能接入ignite监控数据,一般都是广播形式的。
比如有:Zabbix, Prometheus, Grafana, AppDynamics。
ignite自带集群监控工具
Visor Command Line tool:能够查询集群节点、缓存、计算任务的基础监控数据。同时能够进行集群的stop和start操作。
Control Script:比visor要高级不少,能够控制ignite的baseline topology、集群activate和deactivate状态、诊断长lang-running transcations、检查data和index完整性。
gridgain center
GridGain Control Center:这是GridGain公司研发的ignite集群管理工具,有开源、商业两个版本,另外提供saas版本可使用。
- 可定制好dashboad,查看集群状态。
- 超过200个节点管理,定制各种alert。
- 在线执行各种sql去查看data
- 提供opencensus分析,查看一些api的bug
- 对数据丢失等情况能够管理backup和恢复操作
GridGain有点像是ignite定制化开发的工具,支持docker等多种方式部署,也能集成到服务里面。
DataDog
DataDog可以和ignite服务在本地进行集成部署,毕竟丰富的监控内容。
- 带dashboad可以收集并定制化展示
- 跟踪节点弹性memory使用情况,还有详细的GC收集信息
- 通过ignite的heath check提供alert,当节点offline
zabbix
Zabbix是开源的监控工具,支持管理networks、servers、virtual machine、cloud services,提供cpu、disk、network数据监控。
- 通过JMX与ignite集成,并且JMX通过jmx template进行定制化配置
- 5.4及以上版本才能支持ignite
- jmx template支持单节点和多节点部署,是可见的。
以上监控工具中ignite tools建议集成到项目中,其他的都是一些独立监控平台,作为基础服务,建议独立部署使用。
ignite技术是未来内存计算平台的综合方案,虽现初早期,但趋势强劲。