国产AI的尽头,是数据库

国产AI的尽头,是数据库
2024年06月27日 08:03 诗与星空

最近拿到了快手AI视频大模型可灵的内测权限,做了很多尝试,尤其是开放图生视频后,可灵的可用价值非常高。

与此同时,2月份就发布的Sora还在画PPT。在开源大模型领域,阿里的通义千问2.0登上了全球头把交椅。

从这几个月的实际应用来看,AI技术真的没有护城河。强如OpenAI,先发优势也越来越弱。

苹果在发布会上声称要集成chatgpt等多个AI工具,国内可能和文心一言合作。有网友担心换成国产AI会有体验上的不同。

然而星空君认真研究了下苹果的AI功能,发现无非就是自动提取证件图片的信息(顺丰早就实现了)、自动总结邮件摘要(钉钉会议总结用过吧)、自动音频转录文字并语义总结(钉钉、腾讯会议、科大讯飞表示:就这)、AI生成表情包(烂大街)等。

像星空君这种高强度使用AI的选手,可以负责任的告诉大家,绝大多数国产AI都能够做到甚至做的更好。

和去年频繁用梯子访问Chatgpt、ClaudAI相比,今年基本只需要用国产Kimi、通义千问、ChtGLM就足够了,在研报分析、语义总结等方面,国产AI基本和Chatgpt4持平甚至部分超越,偶尔用梯子主要是为了访问C站下载AI绘画大模型。

最近有两个消息引起了星空君的注意:   

一是李开复创立的零一万物宣布,公司成功研发出基于全导航图的新型向量数据库 “笛卡尔(Descartes)”,并已包揽权威榜单ANN-Benchmarks 6项数据集评测第一名。

二是OpenAI宣布收购数据库分析公司Rockset。“巧合”的是,Rockset也在进行向量数据库方面的研发。

所谓向量数据库,是文本、语音、图像、视频等的向量化。与传统数据库相比,向量数据库可以处理更多非结构化数据(比如图像和音频)。在机器学习和深度学习中,数据通常以向量形式表示。

和传统数据库应用相比,AI存储的数据以非结构化的数据为主,所以更适合使用向量数据库。

国产数据库方面,腾讯刚刚发布了云原生的向量数据库,GBase也发布了向量数据库。

随着AI技术的发展,数据库也迎来了百花齐放的新时代。Oracle等传统数据库逐渐退出历史舞台。

01

达梦数据科创板上市

现在很多年轻的开发,认为达梦、金仓等国产数据库无非是在开源数据库的基础上修改、封装,所以可以直接用Oracle等数据库的组件适配。

本质上还是那句:国外一开源,国内就自研。

然而他们不了解的是,达梦数据库最早的版本CRDS,在1988年就问世了,当时甚至还没有MySql。

中日友好时期,日本支援了中国的武钢建设。

1978年,日本技术人员将武钢热轧车间安装完设备,撤离前,他们销毁了包括数据库软件在内的所有技术资料,这些资料达3卡车。当时,华中工学院计算机系一位青年助教正好到武钢学习,看到这一幕,内心受到了震撼。

自此,这个年轻人决心开发能够掌握在自己手里的数据库。

他就是达梦数据的创始人,冯裕才,达梦数据上市的时候,他已经80岁了。

据达梦数据招股书,公司服务于包括建设银行、交通银行、光大银行、兴业银行、广发银行、国开行、中国人寿、邮储银行、中国人保、国家电网、中国航信、中国移动、中国烟草、国家市场监督管理总局、 各级人民检察院、 各级人民法院、国家发改委、国家移民局、证监会、上交所、深交所等在内的知名用户,成功应用于金融、能源、航空、通信、党政机关等数十个领域。根据赛迪顾问及 IDC 发布的报告显示, 2019 年至 2023 年公司产品市占率位居中国数据库管理系统市场国内数据库厂商前列。

可见,如今中国的核心命脉产业,数据库都牢牢掌握在自己手里了。

不过根据星空君的了解,Oceabase、TiDB等非常优秀的国产数据库市场占有率也很高,现在的国产数据库是百花齐放阶段。

结合现在的国产替代化浪潮,几乎可以无脑推断,达梦的市场空间,会进一步爆发式增长。

02

自主可控的赛道有多汹涌

星空君经常对朋友说,人生是旷野,不要拘泥于计划、规划、设想等。

投资领域,自主可控这条赛道,就是无边的旷野。

五年前,星空君鼓吹新能源车赛道;五年后,星空君开始鼓吹自主可控赛道。

自主可控不仅仅是国有企业买台高价国产电脑那么简单,随着大数据交易所、数据资产入表等平台和应用政策的推动,中国已经开启了一条前所未有的数字经济的道路。

而这条道路的地基,就是自主可控。铁路系统的数据库从从Sybase换成自研了,两桶油的数据库从Oracle、Myssql换成Oceanbase、金仓、达梦了... ...

为了安全评估更方便,和这些平台做对接民营企业也开始逐渐向国产系统迁移,从而逐渐带动全行业使用国产自主可控系统。

招股书显示,达梦的业绩一波三折,2021年达到“巅峰”后,2022年有所下滑。

数据来源:同花顺iFind 制图:诗与星空

主要原因是2021年在央企、机关开展了一波国产化替代的进程。因为基数较大,2022年发生了下滑,不过基于公司自身的优势,2023年业绩由重新进入增长通道。

03

AI会重构所有传统业务

尽管星空君不认为AI有什么门槛,但AI的应用会带来革命性的变化,那就是AI会重构所有传统业务。重构的过程,对于企业和投资者来说,就是巨大的机遇。

比如星空君参与的一个传统信息系统AI化改造,用AI+RPA取代了人工抄写单据录入系统的步骤(底座用的国产ChatGLM,后期准备切换到Qwen2.0)。

数据库行业也会遇到这样的变化,AI可以把传统数据库的手工操作变成自动操作。

面对大规模数据和不同的应用场景,传统数据库组件存在业务类型不敏感、查询优化能力弱等问题。目前有研究通过将机器学习算法替代传统数据库组件的方式以实现更高的查询和存储效率并自动化处理各种任务,例如自动管理计算与存储资源、自动防范恶意访问与攻击、主动实现数据库智能调优等。机器学习算法可以分析大量数据记录,标记异常值和异常模式,帮助企业提高安全性,防范入侵者破坏,还可以在系统运行时自动、连续、无人工干预地执行修补、调优、备份和升级操作,尽可能减少人为错误或恶意行为,确保数据库高效运行、安全无失。   

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部