对话华为肖德刚:数据存力,破局AI应用行业化落地“困境”

对话华为肖德刚:数据存力,破局AI应用行业化落地“困境”
2025年04月01日 20:02 第一财经

当前,千行万业正在加速AI应用的场景化探索,尤其是以金融业为代表的数据密集型产业,正在经历从“业务驱动数据”向“数据驱动业务'”的历史性转变,但是从具体业务结构来看,也仅在客户服务、合规风控等方面,呈现出“点”状AI应用场景分布。

与此同时,据国际数据公司IDC报告预测,到2027年中国数据量规模将增长至76.6ZB,年均增长速度CAGR达到26.3%,成为为全球第一。在AI技术跨越式发展以及数据规模爆炸式增长的当下,行业端应当如何去挖掘并验证海量数据的价值,让AI应用场景由点及面的深度覆盖?为此,第一财经专访了华为数据存储产品线副总裁肖德刚。

第一财经:目前,中国在AI行业落地情况如何?面临哪些现实问题?

华为肖德刚:从我们角度来看,近些年AI行业化落地其实挺艰难,远没有想象中这么简单。但是deepseek出来后,发出了许多积极的信号。AI的行业落地有三个非常重要的方面,“高质量的数据”、“适配的算法”、“成本可控的算力”,这三者缺一不可。我们实践发现,国内行业内具有高质量数据的行业并不多,这在数据侧就限制了AI的行业化落地。其次,在算法模型上,以美国为代表的一些厂商算法模型是相对不公开的,这就筑高了行业侧获取高效算法的门槛。最后,算力也是被限制,企业无法单独承担投资建设千卡或万卡算力集群这样一个算力投入。但是,deepseek出来以后,相当于把算法和模型成本门槛拉低了,也一定程度上缓解了算力压力,如果再加上一些行业里高质量的数据,那么我认为AI的行业化落地会加快。

第一财经:行业落地AI应用对数据有哪些要求?

华为肖德刚:我认为有几个角度,第一个是数据要有较大积累量,医院为什么就可以快速落地AI?因为医院诊疗数据基本上是不删除的,病人的数据至少要保存15-20年,这是有监管要求的。但是,以往很多行业(企业)不会存储这么长时间段的数据,因为数据存储需要成本和资源投入。但是随着AI的落地发展,大家会发现数据很重要,不会轻易的删掉,会保存更长时间。第二个是数据要有完整性,各种各样数据都需要被保存,这些数据被保存下来之后还需要进行工程化处理,把它加工成为系统能够理解或者AI应用能够理解的数据,要有一种逻辑把离散的数据串联起来。

第一财经:AI应用将在哪些行业率先落地?

华为肖德刚:目前,我们看到AI在医疗、金融这样的行业应用得较多,一个主要的原因是它们的高质量数据积累较多。例如,医院它有各种各样的诊断报告、病理切片图、病史记录等报告,这些数据经过处理后成为高质量数据,为AI在医疗领域落地奠定了基础。在今年2月,我们就携手瑞金医院发布了“瑞智病理大模型-RuiPath”,通过DCS AI解决方案将病理医生单切片诊断时间从分钟级缩短至秒级,并且模型覆盖了中国90%癌症种类。这个案例里面很重要的是瑞金医院它具有超过100万张病理切片等高质量数据,加上华为数据基础设施的支撑,从而让应用场景较快的落地。

另外金融行业也是一样的,它也具有丰富的数据,包括个人基本信息、消费记录、资产状况等各个方面,这些数据对银行在后期针对特定群体营销、资产管理、贷款风险评估等业务都可以起到重要作用。总体上,金融和医疗算是国内AI应用率先具备落地条件的两个行业。

第一财经:华为携手瑞金医院推出的医疗大模型,对AI应用场景落地有何启示?

华为肖德刚:首先,我认为细分场景可以优先尝试AI行业化落地,在瑞金医院接触过程中我们发现光癌症种类就有上百种,如果要全部覆盖其实会花费很多时间,所以我们先针对某些癌症种类进行了AI应用尝试,并且很快落地了。其次,要有准确的应用场景判断和数据应用场景的串联,瑞金医院瑞智病理大模型是真正解决了医院各个诊室之间在调度病理信息时涉及的数据隔离问题,利用AI大模型高效准确的对病理切片进行诊断,极大的缩短了病理切片诊断时长,让医院里这些离散和繁杂的信息真正为医生带来效率提升。最后,要重视数据的基础处理工作,一是要把数据长期保存下来,二是在保存的基础上,我们还要对数据进行处理,包括数据脱敏、数据格式工程化(标准化、AI可识别化)等。比如病理大模型,它其实是将一张张病理切片图、历史诊疗信息、病人体征等多维度信息进行数据归集整理分析,最后经过AI大模型判断识别生成病理报告。

第一财经:华为在数据基础设施方面,如何助力AI行业化落地?

华为肖德刚:我们现在一个工作重点,就是AI的行业化落地,我们要构建AI-Ready的数据基础设施。AI-Ready的数据基础设施建设主要是围绕两个方向,第一个方向是用AI来赋能我们的数据存储产品和方案,让AI的能力在产品里能够让它更智能、更高效。第二个方向是数据存储for AI,我们的业务边界要扩展到客户的AI场景需求里,比如客户的模型训练、中心推理以及边缘的训推一体等场景。

尤其针对加速数据价值释放,华为提出构建AI数据湖解决方案以提升数据价值密度,释放数据潜能。方案由数据湖存储、Omni-Dataverse(统一数据空间)、AI工具链ModelEngine、数据应用与运营构成。

第一财经:AI应用对金融行业国产数据库部署提出了什么要求?

华为肖德刚:过去我们数据库更多的是与欧美厂商提供的数据库软件生态进行适配,所以数据库的国产化改造其实还有非常长的路要走,我个人认为国产数据库应用推广的问题,不是数据库本身技术,而是整个数据库生态的建设,以及它整个的商业正循环。华为在AI应用落地的大背景下,针对数据库层面其实做了很多事情,尤其是在数据存储方面,我们通过提供国产数据库存算分离方案,提升整个方案的可靠性,例如大规模潮汐集中交易时,如何保障它稳定性和实时性,为客户提供长时间稳定和高性能低时延服务,这是我们正在做的,我们和一些大型银行已经有了批量的案例实践。

此外,我们第二个努力方向就是提升数据库所承载的包括AI在内的应用规模,过去国产化数据库和海外(欧美)数据库一个很明显的差异,就是在应用关键业务场景下有较大差距。

第一财经:在金融数据应用安全层面,华为如何考虑?

华为肖德刚:华为特别重视数据安全,以华为数据存储业务为例,我们40%的收入来自海外,海外客户对“数据安全”这块比国内更为苛刻,这也给我们提供了一个天然“训练场”,我们在产品和方案里面做了非常多的“数据安全考量”,比如防勒索安全方案、数据备份方案、黑匣子方案等等,都是基于全球化视野逐步孵化出来的解决方案。我们每年有接近40%的工作量和投入是在这方面,这是外界看不到的。在高强度投入下,华为数据备份方案荣膺Gartner备份与恢复解决方案“客户之选”,多层联动防勒索方案获得美国Tolly认证,100%有效等市场认可。

纵观人类生产力跃迁史,每一次技术变革都会对当下的基础设施提出新要求。AI时代,数据存储的效能直接决定了智能革命的边界。面向未来,谁掌握了高效、安全、可持续的数据存储能力,谁就能掌握高质量的数据,也就握紧了率先打开AI时代大门的密钥。

0条评论|0人参与网友评论
最热评论

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部