大模型卷价格,向量数据库“卷”什么?
“不是我不明白,这世界变化快”,崔健在20世纪写下的这句歌词,放在公有云市场也同样适用。技术风向的变化之快,让不少人感到惊讶。
2023年初大模型、生成式 AI的起飞,也带来了向量数据库的爆火。投融资项目爆发式增长,头部公有云厂商都推出了AI向量数据库的相关产品。
然而一年狂飙之后,市场逐渐退潮,全球最著名的 AI 项目之一AutoGPT在2024年初宣布,不再使用向量数据库。因此有人质疑,向量数据库又凉了?
不过,随着5月份公有云厂商们掀起价格战,接连调低大模型API的价格,高性价比的大模型+向量数据库,在行业应用、企业市场又显现出了一定的商业价值。
向量数据库这一年的潮起潮落,究竟是火了还是凉了?大模型正在卷价格,向量数据库又该卷什么?公有云厂商又在这一市场发挥了什么作用?今天我们就来聊聊这些问题。
向量数据库,刚刚开始
新技术的火爆,必然会伴随炒作和泡沫,但向量作为大模型理解世界的数据形式,向量数据库作为AI革命重要基建的位置,长期来看是不会动摇的。
为什么这么说?
向量数据库并不是一种特别新的数据库技术,在AI领域已经应用了七八年,谷歌在2015年就宣布使用RankBrain语义检索来处理搜索任务。“如果说数据库是数据的‘硬盘’,那么,向量数据库就是更适合AI体质的‘硬盘’。”
其“AI原生”的体质,具体表现在几个方面:
1.更高的效率。AI算法,要从图像、音频和文本等海量的非结构化数据中学习,提取出以向量为表示形式的“特征”,以便模型能够理解和处理。因此,向量数据库比传统基于索引的数据库有明显优势。
2.更低的成本。大模型要从一种新技术转化为产业价值,必须达到合理的投入产出比,而向量数据库可以有效减少存储和计算成本。一个公开数据是,通过腾讯云向量数据库,QQ音乐人均听歌时长提升3.2%、腾讯视频有效曝光人均时长提升1.74%、QQ浏览器成本降低37.9%,就在于检索效率、运行稳定性、运营效率、推荐算法等,有了较大的提升。
3.更强的数据安全。有企业直言:“沉淀了几十年的内部数据是我的核心竞争力,让我无偿去公开给大模型做训练,我肯定不愿意。”想做大模型,还要确保数据的隐私安全,就必须与数据库产品做好配合,这给向量数据库的本地部署带来了广阔的需求。
4.更大的扩展性。随着大模型走向行业应用,垂直领域的AI用例不断增多,汹涌的数据洪潮和存算任务,会带来大量向量搜索的需求。而向量数据库嵌入向量的长度不受限制,具有良好的扩展性,可以根据AI用例和模型而变化,更好地处理大规模数据集。
从大模型技术标杆的OpenAI发布的GPT-4o和即将发布的GPT-5消息来看,以及国内外商业化大模型的进展来看,大模型的技术路线还没有发生颠覆性的变革,因此落地应用还是需要向量检索和向量数据库。
由此可以肯定,向量数据库市场必然还会迎来一轮增长。趋于冷静,只是2023年热情过度高涨的适当回调。
两大新势力,云是方向
据东北证券预测,到2030…
感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB。
大模型卷价格,向量数据库“卷”什么?