预计推荐系统将在未来几年内激增,并从传统搜索中夺取份额。

作者:阿法兔

封面:Photo by DeepMind on Unsplash

事件

本文 2100 字左右

“搜索” 赛道象征着一种横跨消费者、企业和开发者生态系统的、上万亿美元的机会随着搜索系统变得更加个性化,我们预测搜索和推荐之间的界限将变得模糊。我们预计推荐系统将在未来几年内激增,并从传统搜索中夺取份额。

BVP 最近发了一篇文章,其中提到:

人工智能的技术突破,正在重塑信息合成和检索的新模式。从去年开始像 ChatGPT、Stable Diffusion、Dreamfusion 这类产品的爆红,以及以及即将发布的 GPT-4 等,大模型的潜力激发了不少新的创业公司。这里提到的搜索并仅仅是谷歌这样的公共互联网搜索。

这里的搜索,指的是能够查询信息,并最终综合和得出结论的能力。

这里对 “搜索” 的定义,包含企业(B 端)文件搜索,到 C 端对话式的搜索产品等等。

“搜索” 赛道象征着一种横跨消费者、企业和开发者生态系统的、上万亿美元的机会:通过人工智能驱动的搜索概览图,我们试图探讨一下,究竟是什么在催化这种进化。

重新定义搜索

机器学习和软件基础设施的进步,释放了全新数据类型,并搜索可以具备理解上下文的能力,那么,这些进步来自于哪些原因?

1.  先进的多模态模型出现。想要搜索比如说图像和视频等非结构化的数据是非常困难的。但是,像 OpenAI CLIP 和 LAION 等文本-图像模型那样,近期的进步与技术上的突破,提高了模型的保真度,将非结构化数据嵌入到紧凑表示法中。这些表征通常以矢量体现,这样就可以使更先进的多模态的模型用于图像、视频和其他各类丰富数据类型。例如,Coactive.ai 为图像数据提供了 SQL 的查询界面,能够帮助团队快速访问、组织和利用他们的视觉数据。

2. 语境意识和基本推理的进步:过去的搜索系统提供关键词搜索,但现代模型提供的是语义搜索,或有意义的搜索能力。现代搜索系统也可以感知上下文,并参考用户意图和历史行为。而现在,由于大语言模型的出现,这些系统可以执行基本的推理任务。这样,就带来了一个更为直观和对话式的搜索,它不仅可以理解搜索历史,进行综合研判。

典型的例子就是 OpenAI 的 ChatGPT——提供了更好的搜索工具。ChatGPT 以一种看起来带状态的、像人一样的回应的形式展现信息,用户可以反复完善和调整他们的搜索体验。

比如说,如果一个用户问:"我今天应该穿什么?"人工智能工具可能会先问试探性的问题,如 "你想要大家怎么看待你的风格?"然后再综合得出相应答案。

3. 能够建立在现有的成果的基础上。许多大语言模型通过与 API 的集成和与用户界面的动态交互,插入到现有的软件堆栈中(例如 Perplexity、Adept、OpenAI 的 Codex 和谷歌的 Mind's Eye 的下代搜索产品等等)。同样,像 Seek.ai 和 Hearth.ai 这样的公司,也可以模型嵌入到在数据库和 CRM 中,随着语言模型与现有产品更多地进行对接,搜索系统能够覆盖更多领域,并能更好地进行通知发布。

图片来源:BVP

新兴的大语言模型生态系统

4. 基础设施规模:公司发现了嵌入向量(注解:用一个向量来表示一个词/一个句子/一个图片就叫做嵌入,因为本质是把高维的图像/语言信息在保留一定局部度规的前提下映射到一个较低纬度的空间)的价值,可以在 Zilliz(Milvus)、Pinecone、Vespa 和 Weaviate 等向量数据库以及 Jina、Qdrant 和 FAISS 等开源库上,继续进行构建和扩展工作负载。除此之外,研究人员也在研究模型大小和数据量等因素,到底会如何影响大型神经网络的模型性能。分布式深度学习领域已经开始发展,排期优化和(数据)并行技术能够进一步扩展人工智能模型和数据量。排期优化

5. 搜索和推荐的界限会逐步模糊。随着搜索系统变得更加个性化,我们预测搜索和推荐之间的界限将变得模糊。例如,TikTok 在最近几年发展迅速,字节跳动的个性化、不断改进的推荐模式体验,已经成功地从 Youtube 等传统的视频搜索产品中抢占了市场份额,我们预计推荐系统将在未来几年内激增,并从传统搜索中夺取份额。

人工智能正在重新塑造搜索。我们看到消费者和企业搜索以及基础设施层都有持久的创新。

AI 搜索市场概览

图片来源:BVP

如果我们从人工智能搜索市场的角度来看,目前人工智能搜索赛道已经出现了一系列公司,比如 To C 的(Tik Tok 也算在其中,还有像 Neeva 发布的世界上首个私密和无广告的搜索引擎)、To B,以及专注做基础设施的等等。

智能搜索:刚刚开始的时代

随着人工智能降低高质量创建的内容的质量和制作成本,数字内容的数量将出现爆炸性增长。我们预测,在未来十年内,至少 50% 的在线内容将由人工智能产生、或者由人工智能改进。随着信息爆炸的时代到来,会需要更好的智能搜索,来组织和总结这些信息。
随着用户数据越来越重要,甚至成为企业的关键资产,企业可以用搜索体验来更好地分析数据,以进行商业决策,而在消费者环境中,人们将从更准确、更个性化、更精细的结果中受益,这将影响到人们联系、购物或学习的方式。

参考文献:

1.https://www.bvp.com/atlas/entering-the-era-of-intelligent-search?utm_source=email&utm_medium=organic&utm_campaign=entering-the-era-of-intelligent-search

免责声明:作为区块链信息平台,本站所发布文章仅代表作者及嘉宾个人观点,与 Web3Caff 立场无关。文章内的信息仅供参考,均不构成任何投资建议及要约,并请您遵守所在国家或地区的相关法律法规。