ignite集群监控管理平台05

Owen Jia 2021年03月17日 965次浏览

apache ignite 技术目前已经发展到了v2.10.0 stb,最新beta到了v3.0.0,短短数月已经推进3.0测试了,相信不久就能使用。

今天和大家分享ignite集群技术的监控工具,任何一个分布式计算存储系统都离不开集群的监控管理工具,不然会让运维同学抓狂的。

目前ignite的metrcis数据支持JMX和OpenCensus两种数据格式,能够支持这样数据格式的监控平台理论上都能接入ignite监控数据,一般都是广播形式的。

比如有:Zabbix, Prometheus, Grafana, AppDynamics。

ignite自带集群监控工具

Visor Command Line tool:能够查询集群节点、缓存、计算任务的基础监控数据。同时能够进行集群的stop和start操作。

Control Script:比visor要高级不少,能够控制ignite的baseline topology、集群activate和deactivate状态、诊断长lang-running transcations、检查data和index完整性。

gridgain center

GridGain Control Center:这是GridGain公司研发的ignite集群管理工具,有开源、商业两个版本,另外提供saas版本可使用。

  • 可定制好dashboad,查看集群状态。
  • 超过200个节点管理,定制各种alert。
  • 在线执行各种sql去查看data
  • 提供opencensus分析,查看一些api的bug
  • 对数据丢失等情况能够管理backup和恢复操作

GridGain有点像是ignite定制化开发的工具,支持docker等多种方式部署,也能集成到服务里面。

DataDog

DataDog可以和ignite服务在本地进行集成部署,毕竟丰富的监控内容。

  • 带dashboad可以收集并定制化展示
  • 跟踪节点弹性memory使用情况,还有详细的GC收集信息
  • 通过ignite的heath check提供alert,当节点offline

zabbix

Zabbix是开源的监控工具,支持管理networks、servers、virtual machine、cloud services,提供cpu、disk、network数据监控。

  • 通过JMX与ignite集成,并且JMX通过jmx template进行定制化配置
  • 5.4及以上版本才能支持ignite
  • jmx template支持单节点和多节点部署,是可见的。


以上监控工具中ignite tools建议集成到项目中,其他的都是一些独立监控平台,作为基础服务,建议独立部署使用。

ignite技术是未来内存计算平台的综合方案,虽现初早期,但趋势强劲。