最近,全球最火的开源向量数据库项目Milvus在Github上的标星突破了2万,官方透露已经有超过1000多个中大型企业用户使用. 这一项目的兴起引发了大模型应用的变革之路. 在大模型领域的热潮中,人们开始冷静审视大模型的商业化落地效果,而向量数据库则给大模型应用指出了一条明路.
一度备受瞩目的ChatGPT最近遇冷,知识库管理系统其访问量骤降,知识库管理系统用户数量和网站停留时间也大幅下降. 这个消息在科技圈引起了轰动。ChatGPT发布之后,大模型的热潮在全世界掀起了狂潮. 国内大厂纷纷投入大模型的研发,创投圈则寻找大模型项目进行投资. 然而,就在这个风头正劲的时候,ChatGPT却突然失去了动力. 数据背后反映出了业界的大转变:人们从对AIGC大模型技术的狂热,转向对商业化落地效果的冷静审视。
知识库管理系统大模型应用的变革已经到来,而生产力工具是目前大模型落地的重要方向。然而,仅仅依靠大模型自身的训练数据集是难以实现可用效果的. 为此,产生了两个流派的思考:传统流派试图通过将垂域/私域内容添加到训练集中,实现单模型架构;新兴流派则引入了向量数据库,为大模型提供长短期记忆和领域知识库,实现了ChatGPT + VectorDB + Prompt(CVP)架构.
CVP架构的兴起使得向量数据库这一新的数据库品类成为热门话题. 全球最火的开源向量数据库项目Milvus在Github上的标星已经突破了2万,并且已经吸引了1000多个中大型企业用户. 作为Milvus的原厂,Zilliz已经完成了1.13亿美元的融资,并全面启动了商业化步伐,为大模型落地提供全栈的向量数据库产品和服务.
那么,向量数据库会给大模型应用带来哪些变革呢?我们采访了Zilliz合伙人兼产品负责人郭人通博士,对此进行了探讨。郭博士表示,与单模型架构相比,CVP架构在灵活性、可扩展性、实时性和成本方面都具有明显优势。这是因为在CVP架构中,领域专家可以将领域知识集成到向量数据库中,实现更好的数据利用和处理效果. 同时,向量数据库的高效存储和检索功能可以提供实时的数据访问能力,大大提高了大模型应用的实时性. 此外,向量数据库的成本较低,可以满足企业的实际需求.
正是有了向量数据库的出现,大模型应用的变革才能够实现。它为大模型提供了更多的领域知识和数据支持,使得大模型的商业化落地更加可行. 随着向量数据库的不断发展和完善,我们相信大模型应用的未来会变得更加广阔. 。