生成式人工智能备受瞩目,因为技术人员正在评估去年发布的机器学模型,包括ChatGPT,Stable Diffusion,Dreamfusion以及即将成为GPT-4等。这些大型模型的发展轨迹和力量正在激发新一波创业公司的发展。Bessemer很早就确信大型模型有可能开创技术的新时代。今天,我们坚信人工智能模型也将迎来搜索的新时代。

我们所说的搜索不仅仅指像谷歌这样的公共互联网搜索。我们认为搜索是查询信息并最终综合并从中得出结论的能力。此定义涵盖了从企业文档搜索到会话式消费者产品的所有内容。

搜索是一个跨越消费者、企业和开发人员生态系统的万亿美元机会,通过我们的人工智能搜索市场格局,我们探索了催化这些进步的因素。


(资料图片)

重新构想搜索

机器学和软件基础设施的进步解锁了新的数据类型,并为搜索代理提供了上下文智能。这要归功于:

1. 多模态数据和模型 。从历史上看,搜索图像和视频等非结构化数据一直很困难。正如OpenAI CLIP和LAION等文本图像模型所证明的那样,最近的突破提高了将非结构化数据嵌入紧凑表示中的模型的保真度。这些表示(通常是矢量)可以跨图像、视频和其他丰富的数据类型实现更好的多模态模型。例如,Coactive.ai 为图像数据提供类似 SQL 的查询界面,并帮助团队快速访问、组织和利用其视觉数据。

2.情境意识和基本推理。 过去的搜索系统提供词汇或关键字搜索,但现代模型提供语义搜索或有意义搜索的能力。现代搜索系统也可以是上下文感知的,将意图和历史考虑在内。现在,由于大型语言模型,这些系统可以执行基本的推理任务。结果是一个更直观和对话式的搜索,可以记住过去的搜索并跨来源合成。OpenAI的ChatGPT是最近的一个例子,它提供了明显更好的搜索。ChatGPT 以有状态的呼叫和响应格式显示信息,允许用户迭代优化和调整其搜索体验。如果消费者问“我今天应该穿什么?”该工具可能会回答一个探索性问题,例如“您希望如何被感知?”,然后再综合答案。

3. 在现有工作的基础上再接再厉。 许多大型语言模型通过与API集成并与用户界面动态交互(例如来自Perplexity,Adept,OpenAI的Codex和Google的Mind"s Eye的下一代搜索)插入到现有的软件堆栈中。同样,像 Seek.ai 和 Hearth.ai 这样的公司围绕数据库和CRM包装模型。随着语言模型与现有产品的交互程度越来越高,搜索系统覆盖了更多的领域,并且信息更灵通。

4. 大规模基础设施。 公司发现矢量嵌入的价值,在Zilliz(Milvus),Pinecone,Vespa和Weaviate等矢量数据库以及Jina,Qdrant和FAISS等开源库上构建和扩展其工作负载。同样,研究人员正在研究模型大小和数据量等因素如何影响大型神经网络的模型性能。分布式深度学领域已经出现,产生了优化和并行技术,以进一步扩展模型和数据量。

5. 搜索和推荐。 随着搜索系统变得更加个性化,我们预测搜索和推荐之间的界限将变得模糊。例如,TikTok近年来发展迅速。该公司的个性化、不断改进的推荐体验成功地从 Youtube 等传统视频搜索产品中抢走了市场份额。我们预计推荐系统将在未来几年激增,并从传统搜索中占据份额。

人工智能正在重新构想搜索。我们看到了消费者和企业搜索以及基础设施层的持久创新。

AI搜索市场地图

搜索只是冰山一角

随着人工智能使创建高质量内容变得更容易、更便宜,数字内容的数量将呈爆炸式增长。我们预测,在未来十年内,至少有50%的在线内容将由人工智能生成或增强。随着信息的爆炸式增长,我们欢迎更好的智能搜索代理来组织和合成它。

可能性是巨大的 — 用户数据现在已成为一流的资产,企业可以利用搜索体验更好地分析数据以进行业务决策。在消费者环境中,人们将受益于更准确、个性化和精心策划的结果,从而影响他们联系、购物或学的方式。为这些体验提供支持的是新兴的开发人员生态系统,用于大规模提供搜索查询和建议。

本文发自Bessemer,原题为“Entering the era of Intelligent Search”,作者:BHAVIK NAGDA,感谢TALIA GOLDBERG,SAKIB DADI,KATE WALKER和ALEXANDRA SUKIN,经朋湖网编译整理,供业内参考。

推荐内容