最近,全球最火开源向量数据库项目Milvus在Github上标星突破了2万,透露已经有超过1000多个中大型企业用户使用. 这一项目兴起引发了大模型应用变革之路. 在大模型领域热潮中,人们开始冷静审视大模型商业化落地效果,而向量数据库则给大模型应用指出了一条明路.
一度备受瞩目ChatGPT最近遇冷,其访问量骤降,用户数量和网站停留时间也大幅下降. 这个在科技圈引起了轰动。知识库管理系统ChatGPT发布之后,大模型热潮在全世界掀起了狂潮. 国内大厂纷纷投入大模型研发,创投圈则寻找大模型项目进行投资. 然而,就在这个风头正劲时候,ChatGPT却突然失去了动力. 数据背后反映出了业界大转变:人们从对AIGC大模型技术狂热,转向对商业化落地效果冷静审视。
知识库管理系统大模型应用变革已经到来,而生产力工具是目前大模型落地重要方向。然而,仅仅依大模型自身训练数据集是难以实现可用效果. 为此,产生了两个流派思考:传统流派试图通过将垂域/私域内容添加到训练集中,实现单模型架构;新兴流派则引入了向量数据库,为大模型提供长短期记忆和领域知识库,实现了ChatGPT + VectorDB + Prompt(CVP)架构.
CVP架构兴起使得向量数据库这一新数据库品类成为热门话题. 全球最火开源向量数据库项目Milvus在Github上标星已经突破了2万,并且已经吸引了1000多个中大型企业用户. 作为Milvus原厂,Zilliz已经完成了1.13亿美元融资,并全面启动了商业化步伐,为大模型落地提供全栈向量数据库产品和服务.
那么,向量数据库会给大模型应用带来哪些变革呢?我们采访了Zilliz合伙人兼产品负责人郭人通博士,对此进行了探讨。郭博士表示,与单模型架构相比,CVP架构在灵活、可扩展、实时和成方面都具有明显优势。这是因为在CVP架构中,领域专家可以将领域知识集成到向量数据库中,实现更好数据利用和处理效果. 同时,向量数据库高效存储和检索能可以提供实时数据访问能力,大大提高了大模型应用实时. 此外,向量数据库成较低,可以满足企业实际需求.
正是有了向量数据库出现,大模型应用变革才能够实现。它为大模型提供了更多领域知识和数据支持,使得大模型商业化落地更加可行. 随着向量数据库不断发展和完善,我们相信大模型应用未来会变得更加广阔. 。