加急见刊

分布式计算站点统一部署和监控系统的研究与实现

郑伟; 闫晓飞; 胡庆宝 中国科学院高能物理研究所; 北京100049

摘要:近几年,高能物理合作的分布式计算站点数量越来越多,分布越来越广。物理软件的运行需要有稳定可靠的计算环境和统一的系统软件配置。本文通过对分布式站点统一部署和监控方案进行研究,从分布式架构设计、软件配置的文件同步和监控数据的采集进行了研究和设计,实现站点统一管理和运维。该方案的研究和实现有利于分布式计算站点的统一配置和集中运维,减轻管理和运维成本,保障物理作业在各个站点的可靠运行。

注: 保护知识产权,如需阅读全文请联系科研信息化技术与应用杂志社