本文源自:金融界
金融界2024年12月18日消息,国家知识产权局信息显示,中国石油天然气集团有限公司申请一项名为“面向生产环境的大规模计算集群故障追踪系统”的专利,公开号 CN 119127600 A,申请日期为2023年6月。
专利摘要显示,一种面向生产环境的大规模计算集群故障追踪系统,包括:基于OTF的高性能计算程序监控接口、面向生产环境的高性能计算应用程序监控系统和基于机器学习的故障分析与预测系统,其中基于OTF的高性能计算程序监控接口用于基于OTF技术描述程序状态,面向生产环境的高性能计算应用程序监控系统用于监控程序状态并且产生监控数据,基于机器学习的故障分析与预测系统基于监控数据分析和预测故障。本发明的面向生产环境的大规模计算集群故障追踪系统,对运行在大规模计算集群上的分布式高性能计算程序进行自动插桩,并根据采集得到的数据对集群中各个节点和程序的状态进行分析,方便用户快速发现节点间状态与故障。
4000520066 欢迎批评指正
Copyright © 1996-2019 SINA Corporation
All Rights Reserved 新浪公司 版权所有
All Rights Reserved 新浪公司 版权所有