預計推薦系統將在未來幾年內激增,並從傳統搜索中奪取份額。

作者:阿法兔

封面: Photo by DeepMind on Unsplash

事件

本文 2100 字左右

“搜索” 賽道象徵著一種橫跨消費者、企業和開發者生態系統的、上萬億美元的機會隨著搜索系統變得更加個性化,我們預測搜索和推薦之間的界限將變得模糊。我們預計推薦系統將在未來幾年內激增,並從傳統搜索中奪取份額。

BVP 最近發了一篇文章,其中提到:

人工智能的技術突破,正在重塑信息合成和檢索的新模式。從去年開始像 ChatGPT、Stable Diffusion、Dreamfusion 這類產品的爆紅,以及以及即將發布的 GPT-4 等,大模型的潛力激發了不少新的創業公司。這裡提到的搜索並僅僅是谷歌這樣的公共互聯網搜索。

這裡的搜索,指的是能夠查詢信息,並最終綜合和得出結論的能力。

這裡對 “搜索” 的定義,包含企業(B 端)文件搜索,到 C 端對話式的搜索產品等等。

“搜索” 賽道象徵著一種橫跨消費者、企業和開發者生態系統的、上萬億美元的機會:通過人工智能驅動的搜索概覽圖,我們試圖探討一下,究竟是什麼在催化這種進化。

重新定義搜索

機器學習和軟件基礎設施的進步,釋放了全新數據類型,並蒐索可以具備理解上下文的能力,那麼,這些進步來自於哪些原因?

1. 先進的多模態模型出現。想要搜索比如說圖像和視頻等非結構化的數據是非常困難的。但是,像 OpenAI CLIP 和 LAION 等文本-圖像模型那樣,近期的進步與技術上的突破,提高了模型的保真度,將非結構化數據嵌入到緊湊表示法中。這些表徵通常以矢量體現,這樣就可以使更先進的多模態的模型用於圖像、視頻和其他各類豐富數據類型。例如,Coactive.ai 為圖像數據提供了 SQL 的查詢界面,能夠幫助團隊快速訪問、組織和利用他們的視覺數據。

2. 語境意識和基本推理的進步:過去的搜索系統提供關鍵詞搜索,但現代模型提供的是語義搜索,或有意義的搜索能力。現代搜索系統也可以感知上下文,並參考用戶意圖和歷史行為。而現在,由於大語言模型的出現,這些系統可以執行基本的推理任務。這樣,就帶來了一個更為直觀和對話式的搜索,它不僅可以理解搜索歷史,進行綜合研判。

典型的例子就是 OpenAI 的 ChatGPT——提供了更好的搜索工具。ChatGPT 以一種看起來帶狀態的、像人一樣的回應的形式展現信息,用戶可以反复完善和調整他們的搜索體驗。

比如說,如果一個用戶問:” 我今天應該穿什麼?” 人工智能工具可能會先問試探性的問題,如 “ 你想要大家怎麼看待你的風格?” 然後再綜合得出相應答案。

3. 能夠建立在現有的成果的基礎上。許多大語言模型通過與 API 的集成和與用戶界面的動態交互,插入到現有的軟件堆棧中(例如 Perplexity、Adept、OpenAI 的 Codex 和谷歌的 Mind's Eye 的下代搜索產品等等)。同樣,像 Seek.ai 和 Hearth.ai 這樣的公司,也可以模型嵌入到在數據庫和 CRM 中,隨著語言模型與現有產品更多地進行對接,搜索系統能夠覆蓋更多領域,並能更好地進行通知發布。

圖片來源:BVP

新興的大語言模型生態系統

4. 基礎設施規模:公司發現了嵌入向量(註解:用一個向量來表示一個詞/一個句子/一個圖片就叫做嵌入,因為本質是把高維的圖像/語言信息在保留一定局部度規的前提下映射到一個較低緯度的空間)的價值,可以在 Zilliz(Milvus)、Pinecone、Vespa 和 Weaviate 等向量數據庫以及 Jina、Qdrant 和 FAISS 等開源庫上,繼續進行構建和擴展工作負載。除此之外,研究人員也在研究模型大小和數據量等因素,到底會如何影響大型神經網絡的模型性能。分佈式深度學習領域已經開始發展,排期優化和(數據)並行技術能夠進一步擴展人工智能模型和數據量。排期優化

5. 搜索和推薦的界限會逐步模糊。隨著搜索系統變得更加個性化,我們預測搜索和推薦之間的界限將變得模糊。例如,TikTok 在最近幾年發展迅速,字節跳動的個性化、不斷改進的推薦模式體驗,已經成功地從 Youtube 等傳統的視頻搜索產品中搶占了市場份額,我們預計推薦系統將在未來幾年內激增,並從傳統搜索中奪取份額。

人工智能正在重新塑造搜索。我們看到消費者和企業搜索以及基礎設施層都有持久的創新。

AI 搜索市場概覽

圖片來源:BVP

如果我們從人工智能搜索市場的角度來看,目前人工智能搜索賽道已經出現了一系列公司,比如 To C 的(Tik Tok 也算在其中,還有像 Neeva 發布的世界上首個私密和無廣告的搜索引擎)、To B,以及專注做基礎設施的等等。

智能搜索:剛剛開始的時代

隨著人工智能降低高質量創建的內容的質量和製作成本,數字內容的數量將出現爆炸性增長。我們預測,在未來十年內,至少 50% 的在線內容將由人工智能產生、或者由人工智能改進。隨著信息爆炸的時代到來,會需要更好的智能搜索,來組織和總結這些信息。
隨著用戶數據越來越重要,甚至成為企業的關鍵資產,企業可以用搜索體驗來更好地分析數據,以進行商業決策,而在消費者環境中,人們將從更準確、更個性化、更精細的結果中受益,這將影響到人們聯繫、購物或學習的方式。

參考文獻:

1.https://www.bvp.com/atlas/entering-the-era-of-intelligent-search?utm_source=email&utm_medium=organic&utm_campaign=entering-the-era-of-intelligent-search

免責聲明:作為區塊鏈信息平台,本站所發布文章僅代表作者及嘉賓個人觀點,與 Web3Caff 立場無關。文章內的信息僅供參考,均不構成任何投資建議及要約,並請您遵守所在國家或地區的相關法律法規。