“每日调用量超千亿次。”
作者:涂鸦君
编辑:tuya
出品:财经涂鸦(ID:caijingtuya)
7月4日,腾讯云正式发布国内首个AI原生(AI Native)的自研向量数据库(Tencent Cloud Vector DB),预计 8月上线腾讯云官网。
据介绍,该数据库是腾讯自研、基于内部多年运营积累的分布式向量数据库,已经过腾讯海量业务场景验证,日均处理向量检索千亿次,支持标量+向量的混合检索,具有高性能、大容量等特点,支持全内存索引。主要面向大模型训练,让企业原先花一个月时间才能完成的大模型接入,缩短到三天时间。
天眼查App显示,腾讯科技(深圳)有限公司于近日申请注册两枚“TENCENT CLOUD VECTORDB”商标,国际分类为科学仪器、网站服务,当前商标状态为申请中。
腾讯云数据库副总经理罗云指出,向量数据库已经在QQ浏览器、腾讯视频、腾讯游戏、QQ音乐、搜狗输入法等上百个业务场景应用,每日调用量超千亿次。其中,支撑QQ音乐人均听歌时长提升3.2%,QQ浏览器成本降低37.9%,腾讯视频有效曝光人均时长提升1.74%。
其还自研了分布式向量数据库核心引擎Olama,原ElasticFaiss。据了解,Olama最早于2019年4月进行孵化,目前可支持十亿级别的单行向量数据索引、查询QPS达到百万、响应延迟在20毫秒。
向量数据库源自腾讯集团每日处理千亿次检索的向量引擎(OLAMA),单索引支持10亿级向量规模,更适用于AI运算、检索,数据接入AI的效率也比传统方案提升10倍。
针对大模型场景,向量数据库在接入层、计算层、存储层实现了全面AI化:在接入层,智能化支持自然语言文本的直接检索;在计算层,通过AI算子替代企业寻找/调优AI算法,将接入工期从一个月缩短到3天;在存储层,融合智能压缩算法,把向量存储成本降低50%。
此外,腾讯云在6月19日首次公布了其行业大模型研发进展,依托腾讯云TI平台打造行业大模型精选商店,为客户提供MaaS(Model-as-a-Service)一站式服务,技术底座来自腾讯全栈能力,提供高性能计算集群HCC、高性能网络、向量数据库等基础设施。
4月,腾讯云发布了专为大模型训练设计的新一代HCC高性能计算集群,采用最新一代的腾讯云星星海自研服务器,具备业界最高的3.2Tbps互联带宽,算力性能提升3倍。
一直以来,腾讯在产业互联网中的定位是做产业的“数字化助手”,腾讯云作为中国云市场的头部厂商,目前形成了四级加速框架,为产业输出从底层算力支撑到AI开发平台、到AI产品解决方案、再到顶层数智化转型方法的四级全链条服务,是实现这一目标的重要动力引擎。
展望未来,“向量数据库+大模型+数据”将产生“飞轮效应”,共同助力企业步入AI Native(AI原生)时代。腾讯云也将继续打磨技术能力,提供更坚实的AI基础设施。
4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有