国产基础软件自给率仅5%!百度文心一言,能否打破西方软件的枷锁

国产基础软件自给率仅5%!百度文心一言,能否打破西方软件的枷锁
2023年03月21日 15:00 军武大本营

上周四下午两点,百度在北京总部召开新闻发布会,围绕百度新一代生成式AI产品文心一言。文心一言发布后市场反应非常积极,到周五上午10点钟,申请文心一言API调用服务测试的企业已达到10万家,百度香港股价高开高走,大幅拉升,盘中涨幅最高近15%。百度美国股价3月15日收盘上涨3.8%。

市场对文心一言热烈反馈足以说明这是一款“久旱逢甘霖”式的软件,同时侧面也证明以往中国存在的“软件病”——基础软件的缺失。

要说2020年什么话题最热,那一定是中国的“芯病”。

2020年美国对华为发布超级禁令,不允许任何使用美国技术超过10%的半导体企业向华为提供服务,随后台积电宣布停止向华为提供芯片代工服务。从那时候起,“光刻机”“半导体”等词语逐渐被大家所熟知,人们越来越关心中国的芯片“卡脖子”问题。

▲光刻机的关注度在2020年3月达到顶峰

数据来源:百度指数

可大家不知道的是,中国在半导体领域的窘境还不算最困难的,如果说硬件上我们是被卡得喘不过气,那么基础软件方面则几近窒息。

因为芯片上我们已经解决了有无问题。中国芯片制造龙头中芯国际已经实现了14纳米芯片量产,虽然和国际先进的5纳米制程有一定差距,但凭中芯国际的技术,已经完全能满足国防、航天、交通、能源等方面的需求,只不过在消费端还比不上国际顶尖水平。

然而在基础软件领域,我们距离解决“有无”还差得很远。

有人要问了,咱们中国的软件不是已经很强了吗,微信、抖音、淘宝等软件就连老外用过都无法自拔,怎么能说我们连有无问题还没解决?

其实这里说的基础软件不同于微信、抖音等生活软件,而是指诸如计算机辅助设计CAD、计算机辅助工程CAE等专业类工具基础类软件。2020年度《中国工业软件白皮书》中披露了一组数据,国产工业软件在生产控制、经营管理、运维服务的国内市场中能占到50%、70%和30%的份额,可是在最重要的研发设计类软件中,国产率只有5%,也就是说有95%的研发设计软件需要国外,特别是西方企业授权。

▲数据来源:《中国工业软件白皮书》

我们想用人家的软件,得先交钱。

目前世界上几乎所有飞机研发团队都在使用一款叫做CATIA的软件,开发者是法国的达索公司,就是那个造阵风战斗机的企业,同时达索也是全球航天航空工业软件方面无可争辩的领袖。

中国航空工业也不例外,几乎飞机设计全过程都在CATIA为基础的平台上展开,同时气动外形的设计还要用到Fluent、AAA;结构设计会用到MSC、Analsis;操作系统、动力系统、控制系统还会用ADMS、Simulink等,这些统统是国外软件。

使用这些软件的成本非常高,就拿CATIA为例,国内任何一家航空设计所花在这款软件上费用都超过了千万,而且每增加一个使用账号要另外交钱,升级版本也要加钱。设计一架飞机需要十几甚至几十种软件,软件开支可想而知。

尽管交了钱,能不能用还得看别人脸色。

2019年,美国商务部把华为列入实体清单,导致华为无法用最新芯片设计工具EDA设计芯片;

2020年6月,哈尔滨工业大学、哈尔滨工程大学等多个大学和科研机构,被美国以涉军为由,限制使用数量分析软件Matlab,科研项目只能放缓;

2022年3月,美国设计软件公司Figma发布消息,由于大疆无人机在美国政府制定的实体清单上,禁止大疆使用Figma;

信息时代,基础工具软件是各行业离不开的,而这些工具软件往往需要巨量投入、积累和反复打磨才有可能在边做边用,越用越好的过程中成为生产的核心辅助力量。

上世纪90年代,大批西方软件涌进中国市场,比如西门子等公司和国内学校、科研机构进行低价合作、搭配销售等措施对软件进行推广,同时他们也放任盗版横行,国内机构和企业能以免费的方式享受工具软件的便利,让西方软件在中国如入无人之境。

▲资料来源:鲸准数据库

然而在今天,曾经的“温存”已经变成了悬在我们头顶的达摩克利斯之剑,而且随时可能挥下。

现在我们需要各行各业领军者们站出来,去进行一场“软件大会战”,也许这个项目需要从零开始,也许需要投入回是无底洞,也许相当长一段时间可能不会有收益。但必须有人站出来,去补上以前欠的账。不仅如此,我们还需要把目光放在新兴领域,跟着别人的脚步只能亦步亦趋,放眼未来,我们在基础软件上才能有弯道超车的机会。

去年11月,美国Open AI公司上线了一款名为ChatGPT的生成式AI,相比之前的聊天机器人,ChatGPT显得更加聪明,它可以非常自然地和人类聊天,除了聊天,ChatGPT还能胜任许多复杂的语言工作,比如写论文、写策划、写代码。

ChatGPT出现后,全世界几乎所有关注科技的人或多或少都参与了关于它的讨论。电话普及用户达到1亿人,用了75年;手机普及用户达到1亿人,用了16年;而ChatGPT仅用了60天,全球活跃用户就达到了1亿。

显然人工智能现在已经成为了整个科技界的风口,如果说新世纪的第一个20年是智能手机+移动互联网的移动互联时代,那么下一个20年必将会是人工智能+机器人的AI生产力时代,AI软件实力将决定21世纪中后程的国运。

▲AI已经是一种新基建

所以人工智能领域是中国丢不起的阵地,再难也必须把这块骨头啃下来。然而Chat GPT不属于中国,未来如果AI技术深入到千家万户,如果我们只能用国外的AI,那么就等于把移动互联时代的达摩克利斯之剑又举到了自己头上。

好在目前全球范围内来看,也只有中美两个大国有大规模发展AI产业的机会。其实中国的AI起步并不晚,早在2020年百度就已经开发出了有16亿个参数、类似ChatGPT的通用对话生成模型PLATO-2,和当时的GPT-2的参数量是同一级别的。

▲人工智能的赛道上只留下了中国、美国两个选手

Open AI发布Chat GPT3.5、4.0的时候,百度也紧跟其上发布基于百度新一代大语言模型的生成式AI产品文心一言,无疑是给国产AI产业注入了一支强心针。

从百度CEO李彦宏的演示来看,文心一言在文学创作、商业文案写作、数理逻辑推算方面已经展现出颇为突出的能力。

由于多年搜索业务的积累,百度拥有世界上最大的知识图谱,而AI的机器学习恰好需要海量数据满足,百度率先推出中国的大语言模型,确实是有得天独厚的优势的。

同时在百度搜索中,问答和生成类的问题本来就占比很多,百度拥有的数据形态也最贴合大语言模型的训练需求,同时训练的数据样本多以中文呈现,所以文心一言应当是目前中文领域最先进的语言模型。

距离文心一言发布已经过去了4天,军武菌发现不少参与了测试的网友表达感受,体验大体不错但也有不足,其实前期不完整的体验本身就是此类大数据模型本身的特质。

大语言模型本身就是在不断进化中的。不管是文心一言还是ChatGPT,使用的底层技术方法都是一致的,都会经过从人类反馈中进行强化学习、开放后接收真实的用户反馈,再强化学习的过程。听不懂没关系,简单来说就是ChatGPT和文心一言一样,在大家使用过程中不断进化,不断学习如何理解人类问题。

▲文心一言已经具备文字生成视频的能力

而不同于人类的学习过程,大数据模型的进化是非常快的,因为有每天有数以亿计的数据供其训练,迭代会非常快。现在文心一言还是牙牙学语的孩子,也许三个月后就是学富五车的资深教授了,所以现在即使有所不足,未来的文心一言的表现依然非常值得期待。

抛开文心一言不说,百度下功夫去做AI这件事本身就值得称赞。

我们之前说过,中国基础类软件必须有人要站出来敢为人先。现在属于AI的未来已来,百度敢站出来做这么一件可能很久很久都不会产生利润的事,需要极大的魄力和决心,因为在每一个领域,第一个吃螃蟹的人都是九死一生的。

就拿训练AI的成本来说,一般来说跑一次100亿参数量的模型就需要1000张GPU卡,就是我们常说的显卡,不过是专门用来做算力的那种。目前AI训练领域使用最多的是英伟达的A100计算卡,一张就要1万美元,也就是说单跑通一次100亿参数量的模型光显卡就要1000万美元。而文心一言这样的大数据模型,参数量动辄以千亿计。

▲A100计算卡被美国断供,价格已经来到9万元一张

训练大模型难度越来越高

云计算技术业内公认的一个说法是,1万张A100GPU卡是做好AI大模型的算力门槛,也就是说1亿美元的硬件只是做AI大模型的基础条件。

百度10年间在研发上的投入已经超过1000亿元,去年百度核心研发费用是214.16亿元,占百度核心收入比例的22.4%,几乎每一年的同比增长都超过100%,在世界大厂中也属于凤毛麟角的存在。正是由于百度先前不计成本在算力硬件上的投入,在做大模型训练时候才能顶得住超高算力需求。

有人还说过这么一句话:2017年美国公司在做阿尔法,中国公司在送外卖;2022年美国在做ChatGPT,中国公司还在送外卖。

据最新发布的《2022中国数字经济金融分析报告》显示,2021年中国数字经济已经达到45.5万亿元,占国内GDP的39.8%。百度、腾讯、阿里等行业大厂无疑在其中担当了非常重要的角色,但这些有实力的中国互联网高科技企业应当有所为,有所不为。

这些企业作为中国科技进步的先锋队,技术力量是用来送外卖、做购物好呢?还是用来投入AI大模型,布局未来更好呢?不用说大家也明白。但做研发,做创新的风险和巨额投入不是每家公司都愿意承担的,所以百度这样的公司就更难能可贵。

眼下人工智能是未来的基础建设已经是共识,中国要赶上时代的洪流,就必须依靠这些愿意坚持创新投入的企业,而社会能给他们的支持,就是在漫长的研发过程中,为他们提供健康、有利、安静的发展空间。

▲中国AI一定会行

最后军武菌改编/引用鲁迅先生的文字,为中国AI事业加油:愿中国企业/社会都摆脱冷气,只是向上走,不必听自暴自弃者流的话。能做事的做事,能发声的发声,有一分热,发一分光。就令萤火一般,也可以在黑暗里发一点光,不必等候炬火。此后如竟没有炬火:我便是唯一的光!

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部