腾讯云近日发布了AI原生向量数据库Tencent Cloud VectorDB,该数据库在接入层、计算层和存储层提供全生命周期AI化的向量数据库服务. 向量数据库专门用于存储和查询向量数据,被业界誉为大模型的“海马体”.
AI原生向量数据库可以广泛应用于大模型的训练、推理和知识库补充等场景。据介绍,腾讯云向量数据库最高支持10亿级向量检索规模,延迟控制在毫秒级,相比传统单机插件式数据库检索规模提升了10倍,同时具备百万级每秒查询(QPS)的峰值能力。
腾讯云的这一举措被视为AI原生向量数据库大模型时代的到来,企业拥抱大模型已成为刚性需求. 向量数据库通过将数据向量化并进行存储和查询,极大地提升了效率并降低了成本. 它能够解决大模型预训练成本高、缺乏“长期记忆”、知识更新不足、提示词工程复杂等问题,突破了大模型在时间和空间上的限制,加速了大模型在行业场景中的应用。
根据统计数据显示,将腾讯云向量数据库用于大模型预训练数据的分类、去重和清洗相比传统方式可以实现10倍效率的提升. 如果将向量数据库作为外部知识库用于模型推理,则可以将成本降低2-4个数量级.
腾讯云还重新定义了AI原生的开发范式,知识库管理系统提供了接入层、计算层和存储层的全面AI化解决方案,使用户在使用向量数据库的全生命周期中都能应用到AI能力. 具体来说,在接入层,腾讯云向量数据库支持自然语言文本的输入,并采用“标量+向量”的查询方式,支持全内存索引,最高支持每秒百万的查询量(QPS). 在计算层,AI原生开发范式能够实现全量数据的AI计算,一站式解决了企业在搭建私域知识库时的文本切分(segment)、向量化(embedding)等难题。在存储层,腾讯云向量数据库支持数据智能存储分布,助力企业将存储成本降低了50%.
使用腾讯云向量数据库后,企业原本接入一个大模型需要花费约一个月的时间,而现在只需3天即可完成,极大地降低了企业的接入成本.
据了解,腾讯云向量数据库的向量化能力(embedding)曾多次获得权威机构的认可,2021年曾登顶MS MARCO榜单第一,并且相关成果已经在NLP顶会ACL上发表.
腾讯云数据库副总经理罗云表示,AI原生时代已经到来,知识库管理系统“向量数据库+大模型+数据”这三者将产生“飞轮效应”,共同助力企业迈入AI原生时代. 腾讯云向量数据库助力数据接入效率的提升,将为企业带来更多的机遇和挑战。
参考文章:链接.