中国石油天然气集团申请面向生产环境的大规模计算集群故障追踪系统专利,方便用户快速发现节点间状态与故障

中国石油天然气集团申请面向生产环境的大规模计算集群故障追踪系统专利,方便用户快速发现节点间状态与故障
2024年12月18日 14:55 金融界网站

本文源自:金融界

金融界2024年12月18日消息,国家知识产权局信息显示,中国石油天然气集团有限公司申请一项名为“面向生产环境的大规模计算集群故障追踪系统”的专利,公开号 CN 119127600 A,申请日期为2023年6月。

专利摘要显示,一种面向生产环境的大规模计算集群故障追踪系统,包括:基于OTF的高性能计算程序监控接口、面向生产环境的高性能计算应用程序监控系统和基于机器学习的故障分析与预测系统,其中基于OTF的高性能计算程序监控接口用于基于OTF技术描述程序状态,面向生产环境的高性能计算应用程序监控系统用于监控程序状态并且产生监控数据,基于机器学习的故障分析与预测系统基于监控数据分析和预测故障。本发明的面向生产环境的大规模计算集群故障追踪系统,对运行在大规模计算集群上的分布式高性能计算程序进行自动插桩,并根据采集得到的数据对集群中各个节点和程序的状态进行分析,方便用户快速发现节点间状态与故障。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部