商業化需要更多的產品化努力,而不僅僅是數據化能力。

作者:Future3 Campus,Footprint Analytics

AI+Web3 或將成為未來行業融合創新的一大突破點。 Future3 Campus 在與 Footprint Analytics 攜手編撰《AI 與 Web3 數據行業融合的現狀、競爭格局與未來機遇探析》研報期間,也對多位知名投資機構代表進行了採訪。 本文根據訪談內容整理,僅代表受訪嘉賓觀點,不代表 Footprint 立場。

如何看待 AI+Web3 數據的結合? 有哪些值得關注的方向?

Hashkey Capital-Harper:我認為 AI 和 web3 數據的集合有幾點:一是通過 LLM 模型將語言轉化生成 SQL,比如 Dune,還有些專案專門做 search engine 的,要強化 SQL,才能去正確調取資料庫里的數據,還有利用自然語言就能自動生成 SQL,讓開發者複製後去使用。 二是聊天對話方式,基於 chatgpt 改造的聊天 agent,主要針對提供聊天視窗的,不那麼強調在 SQL 和搜索優化上,它更隨意點,比如請告訴我哪個 KOL 喊單了,這個安全事件對 token 的影響有什麼(這個時候可能就是全網搜索出來一個結果,這裡就不會強調調取資料庫的 SQL 優化)。 三是通過 AI 創建合適的模型將鏈下和鏈上數據進行整理,提取更好的 insight。

相比之下,一需要專案方有更強的資料庫搭建能力,因為 Web3 的數據處理起來很麻煩,不過要達到準確性和速度,這個還是很難的; 二是個比較簡單的結合方式,門檻也不太高。

SevenX Ventures-Yuxing:其實數據是 AI 的養料。 Web3 的數據公開且可驗證,而 AI 的問題在於它的黑盒特性,難以驗證。 這兩者結合,可以產生一些有趣的化學反應。 目前我更傾向於把 AI 和 Web3 的結合分為兩類,不是簡單的 AI 加 Web3 數據,而是考慮 AI 如何讓 Web3 變得更好,以及 Web3 如何讓 AI 變得更好。

首先 AI 對於 Web3 數據來說,能夠有效利用 Web3 數據公開可驗證的特性。 任何 AI 都可以使用 Web3 數據,提煉併產生價值,無論是投資建議還是預警分析,AI 能夠説明 Web3 數據處理和分析增加效率。 另一方面,Web3 可以增加 AI 的可信度,因為 Web3 本身就是一個新型的信任機制。 通過 Web3 的數據公開可驗證的特性,可以提高 AI 的透明度,甚至在新聞報導或紀實等重要領域,可以用 Web3 的方式存儲關鍵資訊,這就能夠去避免 AI 存在的一些問題。

而這些問題中比較常見的就是 AI 的造假問題,還有 AI 黑盒問題。 AI 的演算法有些可能比較容易理解,但是有的演算法很難解釋,比如像神經網路這樣複雜的演算法,還有 GPT,人們可能會質疑他的答案是如何產生的,它的數據和演算法都不夠透明,讓人感覺像是魔術。 例如,之前的人臉識別演算法將黑人錯誤識別成大猩猩,這是因為其數據樣本中黑人的圖片太少。

如果 AI 模型使用的資料都是可驗證的,我們就可以更容易辨別數據是否有樣本偏差。 使用 Web3 的數據,因為其透明性,整個 AI 模型的訓練源和結果都會更加明晰。 這樣一來,我們就能更公正地看待 AI,理解它的決策源,減少偏見和錯誤。

黑盒問題可以粗略分為兩部分。 一部分是模型演算法本身的黑盒,包括模型怎麼訓練,內容怎麼生成,不論從訓練過程還是演算法機制層面都存在不透明或不可解釋。 另一部分是數據的黑盒,不公開數據,訓練集的問題也會導致最終結果偏差。

這個偏差如果說是內容準確性上的問題,我們還可以去持續改善,但如果是一些意識形態方面的問題,尤其是政治或種族歧視等方面的問題,可能就不容易糾正了。 這種時候就只能去把控數據輸出了,比如現在很多國家系統或國企系統的 AI 模型,它最重要的一點就是去控制它的輸出,什麼不能講,這個是最難做的,這一定程度上跟剛剛的這個意識形態偏差是類似的。

Qiming Venture Partners-唐弈:對於 AI 和 Web3 數據結合方面,我個人認為,AI 在這個領域可能有些許炒作,噱頭大於實際效用。 因為從我看來,Crypto 的數據產品還處於相對早期階段,在數據方面的基礎工作還不夠紮實。 在這種情況下,過早地引入 AI 或過多的數據分析可能為時過早。

此外,從使用者角度來看,大部分加密專案和 AI 結合的場景並不太成立,或者說用不太到 AI。 因為這波比較火的 AI 模型,特別是生成模型,是建立在大規模互聯網數據的基礎上的,比如語言處理和圖像生成等能力。 儘管有人利用生成式 AI 改進用戶體驗,提供更好的互動和對話感,但這對於大多數場景而言可能價值有限。 我認為如果談論更廣泛的 AI(數據分析能力或更簡單的 AI 模型)可能還有些場景,比如基於數據給 NFT 進行價格估算,或者專業的交易團隊可以利用數據執行一些交易操作。 總體而言,對於目前這波 AI 浪潮,我暫時還沒有看到可以為加密貨幣產業帶來特別短期效益的機會。

當然,我也看了一些早期專案正在嘗試通過 AI 提高數據處理或分析方面的能力。 舉個例子,我看到早期專案正在使用 AI 能力來解釋智慧合約的邏輯或進行分類識別等工作。 這些工作在智慧合約和加密貨幣領域要求較高的準確性,因為涉及到交易等關鍵動作。 因此,我可以想像,使用一些 AI 能力來進行數據預處理可能是有意義的,但最終可能仍需要人工干預來確保準確性。 如果您希望通過 AI 能力直接觸發交易,除了專業的交易者外,我認為產品方面還需要取得很大進展。

Matrix Partners-子熹:我們觀察了很多關於 Web3 的數據專案,比如我們投資了 Footprint,起初我也是它的一個忠實使用者,另外還有 Dune。 Footprint 和 Dune 我覺得主要針對 VC、開發者以及一些小型企業的服務,真正的普通和這些服務的聯繫並不大。

另外我們也看了一些與加密貨幣交易或者盈利直接相關的數據分析公司,像 Nanson、defilama、token terminal、dappradar,當然還包括 Dune 和 Footprint。 這些公司對 VC 和開發者來說非常有用,但它們的盈利能力似乎有限。 原因在於目前 VC 和開發者對這些數據的總體需求量還不夠大,而且他們的付費意願也不強,因為即便某些服務不是免費的,也總有其他公司提供類似的免費服務。

我們還看了一些類似於數據雲倉的公司。 我們也和騰訊領投了 Chainbase。 他們其實就像是一個數據平台,他們提供安全類、交易類、NFT 類、DeFi 類、遊戲類、社交類數據,還有一些綜合性的數據。 開發者可以在這些平臺上組合這些數據來生成自己所需的 API。

在熊市中,我們注意到像 Chainbase、Blocksec、footprint 這樣的公司,它們的很多客戶實際上是中小型創業公司。 例如 Chainbase,它的一些大客戶收入並沒有下降,但是中小型客戶的收入在兩三個月後就降為零了。 這表明這些項目因為缺乏資金而無法繼續。

因此,對於數據供應商來說,熊市中若沒有新的開發者加入,他們就很難賺錢。 這也反映出目前在 Web3 領域,數據供應商主要是靠那些認為數據有用的開發者和小型企業,他們並內部整合這些數據,然後再進行變現,平衡收入和產出。

核心我們還是覺得,目前無論是 ToC 還是 ToB 的 Web3 數據公司盈利模式都不是很清晰,這導致數據供應商沒有一個強大的穩定的現金流。 尤其是對於那些中小型的創業者來說,這是我們覺得目前 Web3 數據行業最大的一個弊端。

然後再回到 AI 和 Web 數據結合的話題。 我們最近也看了和投資了一些 AI 相關的數據公司。 我覺得 AI 數據公司實際上也面臨著同樣的問題,就是數據的銷售。 你需要考慮客戶的成本和他們產出的效果之間的平衡。 目前來看,我對 AI 數據公司的盈利前景還是比較樂觀的,但這主要限於海外市場。

如果只瞄準國內市場,我擔心最終的結果可能會和投資 Web2 SaaS 公司一樣,可能有收入,業務規模不會太大,客戶的付費意願也不是很強。 你可能還需要提供定製服務,這樣你的毛利率也不會很高。 所以我對在國內做這個是比較悲觀的,對在海外做這個是比較樂觀的。

您認為 AI 能夠給 Web3 數據基礎設施和 Web3 數據公司帶來哪些價值? 現在利用 AI 説明 Web3 數據的專案效果怎麼樣呢? 在商業模式方面是否能有些創新?

SevenX Ventures:我認為 AI 對 Web3 數據最大的説明是效率方面。 比如 Dune 發佈了 AI 大模型的工具來做代碼異常檢測和資訊索引,使用者可以去用自然語言去查詢相應的數據,它的代碼就會相應地進行生成,然後還可以去做代碼的優化,這個就是效率方面的一個提升。

另外還有用 AI 做安全預警的專案,它就是將 AI 經過相應的訓練之後,可以去快速的去識別安全問題的一個 AI Robot。 比如 AI 演算法裡邊就有一個演算法叫異常檢測,效果比從純數學統計的方法直接去看數據的分佈,檢測出一個異常值要更好,所以這種 AI 可以更有效地去做安全方面的監測。

另外我還看到一些專案使用 AI 演算法,比如大語言模型來檢索整個 Web3 的新聞數據(不只是鏈上數據),進行資訊聚合和輿情分析,形成一個 AI Agent。 比如使用者可以直接在對話框裡面去查某個代幣最近 30 天或者 90 天的網路輿情,使用者是更偏向於看多,還是看空,給予相應的分值來體現熱度; 它還會有個曲線,通過這個曲線就可以判斷一個代幣它是在大家討論到頂峰的時刻,還是在一個頂峰下降的時刻,還是在一個上升的時刻? 這些可以輔助用戶投資,我覺得也是一個挺有意思的應用方式。

但也有些其他的項目宣稱自己的數據是 AI 的數據源蹭 AI 概念,我覺得這有點牽強,因為任何鏈上數據都可以是 AI 的數據源,因為它是公開的,所以有點蹭熱點的嫌疑。

Matrix Partners-子熹:商業模式是現在數據領域的一個大問題,要找到一個解決方案很難。 可能在 ToC 端,利用 Web3 的一些概念,比如 token 或分散式概念,可以讓 AI 數據採用不同的商業模式。 但如果是 AI 技術賦能數據,目前並沒有太多亮點。

AI 在數據處理和清洗方面可能有輔助作用,但這更多是內部的説明,比如在產品開發過程中提升功能或用戶體驗。 但從商業角度來說,並沒有太大改變。

AI bot 確實可以增加一些競爭力,輔助使用者,但目前來說這不是一個很大的優勢點,核心競爭力還是取決於數據源的品質。 如果數據源充足,我可以獲取我需要的資訊。 問題是,如果這些數據要商業化,那麼我組合出來的東西必須能變現,我才願意為數據支付費用。 現在的問題是,市場不好,初創公司不知道如何變現數據,也沒有足夠的新進場初創公司。

我覺得目前有意思的反而是一些 Web2 的公司,它們使用了 Web3 的技術。 比如一個合成數據的公司,他們通過大模型生成合成數據去使用,數據可以主要應用在軟體測試、數據分析,以及 AI 大模型訓練使用。 他們在處理數據的時候涉及到很多隱私部署的問題,使用了 Oasis 區塊鏈,可以有效避免了數據隱私問題。 後面他們還想做一個數據交易所,將合成的數據包裝在 NFT 裡進行買賣,解決確權和隱私問題。 我覺得這是一個很好的思路,它用 Web3 技術來輔助 Web2 解決問題,不一定局限於 Web3 的公司。 不過,目前合成數據的市場還不夠大,早期投資這樣的公司有風險。 如果下游市場做不起來,或者競爭對手太多,情況也會很尷尬。

在 AI+Web3 數據的領域,有沒有投過一些比較好的專案,分別是什麼方向的,決定投他們的關鍵因素是什麼? 您認為這類專案的核心競爭力是什麼? AI 是否會加強這個競爭力?

Hashkey Capital-Harper:我們投的數據項目比較早,基本都是還沒有特彆強調 ai 的時候就投了,比如 space and time、0xscope、mind network、zettablock 等,投的關鍵是看他們的定位和數據品質。 現在這些項目都會有 AI 的計劃,基本也是先從聊天 agent 開始。 space and time 和 chainML 合作推出了創建 ai agent 的基礎設施,其中創建的 defi agent 被用於 space and time,也是一種結合 AI 的方式。

SevenX Ventures-Yuxing:如果專案與 AI 的結合做得很好,那麼我可能會對其更感興趣。 決定我是否會投資的關鍵因素之一是專案是否有市場壁壘。 我觀察到很多項目宣稱他們與 AI 結合能夠提升效率,例如快速的數據查詢功能。 有些項目可以通過自然語言查詢來快速獲取鏈上 NFT 數據,比如查詢最近交易最活躍的十大 NFT。 這樣的專案可能有先發優勢,但市場壁壘可能並不牢固。

真正的壁壘是 AI 本身的應用以及工程師如何將 AI 應用到具體場景中。 工程師如果能熟練地進行模型微調,通常能夠獲得良好的效果。 對於那些提升效率的項目來說,市場壁壘主要在於數據源。 不僅僅是鏈上數據,還包括專案方如何處理和解析這些數據。 例如之前提到的專案,它們能夠通過 AI 演算法快速檢索重要數據。 然而,工程師進行模型微調的效果是有限的,真正的持續優勢在於數據源的品質和其持續優化的能力。 這也是為什麼一些數據分析公司能夠在市場中脫穎而出的原因,他們不僅提供數據源,還包括數據處理和分析的能力,區別往往在於團隊的技術能力和人才。 這些因素直接關係到 AI 結合應用的最終效果,

另外,我也關注那些能讓 AI 變得更好的 Web3 技術專案,因為 AI 市場非常龐大。 如果 Web3 技術能夠增強 AI 的能力,那麼應用場景將會非常廣泛。 這就是 ZKML 專案受到熱捧的原因。 但是,我注意到 Web3 專案往往容易被誇大或貶低其價值。 像 ZKML 這樣的專案,儘管備受關注,但它們的投資回報並不像人們期待的那樣迅速,退出機制也並不清晰,因為它們發行代幣的難度較大。 因此,儘管這些專案富有創意並具有潛在價值,但是否值得現在投資,以及它們最終能帶來多少回報,是投資者需要仔細考量的。

Matrix Partners-子熹:我們投資了一個結合 AI 和 Web3 的公司,它是一個數據標註公司,叫 Questlab。 他們使用區塊鏈技術提供數據標註的眾包服務。 數據標註原本是一個直營或者是分包的行業,很難做到知識領域的全覆蓋。

就傳統的數據標註來說,一般分為三個類型:直營、分包和眾包。 但實際上做眾包的人比較少。 這三種模式的公司在選擇數據標註服務時需要考慮的因素有:價格是否便宜、標註的品質是否高、效率如何。 還有一個就是能否覆蓋他們所在的行業。 如果你只是做一些通用模型的語言或圖片的標註,其實很簡單,就是識別英文字或圖片。 再難一點,比如需要區分貓、狗、月亮、嬰兒車等,這也不是很難。 但如果你需要做的是更專業的標註,比如語音機器人社區需要的標註,那就複雜多了。 他們可能需要標註各種方言和多種語言,包括中文方言,英文方言、以及各種小眾地區的語言等,很少有傳統的工作室願意做這樣的工作。

一個更複雜的例子是法律加 AI 公司,需要標註大量的法律知識來訓練各種模型,要找到既懂法律又能進行專業標註的人非常難,需要同時懂得各國法律,還要瞭解各種專業法律領域,如合同法、租賃法、民法、刑法等。 市場上幾乎沒有一家數據標註公司能夠提供如此專業的服務。 法律是專業的,金融、生物、醫療、教育等也是如此。 所以,這些領域的標註工作一般只能由內部團隊來完成,他們使用眾包的方法,這樣就能解決知識專業覆蓋的問題。

我們認為,利用區塊鏈進行眾包是一個很好的方向,就像 YGG 在 Gamefi 領域做的事一樣。 這是我們認為是一個有前景的方向。

另外,我們覺得在開源模型社區裡面,也會有一些很好的機會。 比如 Polychain 投的一個專案是一個類似於 web3 的 hugging face,用來解決模型內容創造者經濟的問題。

其他的 AI 和 Web3 的結合,我覺得 ToC 方向如果能結合一些 token 的玩法,提高整個社群的粘性、日活和情感,我們覺得這是可行的。 這也方便投資人來變現,但是市場規模如何也不是很確定。 這就是我對 AI 和 Web3 的一些看法。 我覺得如果純 ToB 的業務,沒必要用 Web3,就用 Web2 的方式做就挺好的。

Qiming Venture Partners-唐弈:目前我們投的有一些數據專案正在通過鏈上數據在安全場景中進行工作。 我認為一些 AI 基本的模式識別或特徵發現工作都有涉及,並且效果還可以。 然而,更高級的工作,如將大量活動數據輸入模型並識別多種資訊,目前仍在嘗試階段,效果尚需驗證。 除了安全領域外,許多其他領域也存在類似情況。

最近的一個例子是我們投的 NFTGo,它是一個基於大數據分析去做 NFT 的定價,具有一定的準確性,並計劃將其用於價格 Oracle 等用途。 雖然這一體系聽起來很有趣,但在產品中以及使用者接受程度方面,仍需要進行驗證。 因為即使目前可能能夠達到 90 分或 85 分的準確性,使用者可能需要更高水準,比如 98 分或 95 分,因此還需要進一步驗證。 因此,雖然一些專案正在將數據分析和模式識別等簡單 AI 能力應用於產品中,但是否成為關鍵因素尚未得到驗證。

而對於投資意願方面,我個人不會因為專案有一些 AI 的噱頭就更傾向於投資,因為我認為實際效果和專案是否能實現其目標以及帶來好處更為重要。 如果一個專案只是在名字或市場行銷上有亮點,作為一種行銷手段,以吸引更多關注或曝光,我能理解。 但在投資決策中,我認為更重要的是實際效果。

像一些專案在做 ZKML,這個賽道似乎備受矚目,但是同時也有很大問題,就是它到底用於什麼場景。 我覺得目前不確定性特彆強烈,更多還是很宏大的敘事。

從整體行業發展來看,AI + Web3 數據這一賽道未來有哪些潛在的機會或發展方向? 未來,AI 是否有可能徹底升級數據產品,引入新概念? 是否會增強使用者的付費意願?

Hashkey Capital-Harper:肯定是有潛在機會的。 未來發展方向其實還是落後於 web2 的 AI,那裡的創造力明顯更強,web3 這邊的 AI 大概率也是 web2 AI 的映射實現吧。

Matrix Partners-子熹: 我覺得最近的妙鴨相機讓大家意識到,其實人們對 AI 產品還是有付費的意願的,這不像傳統的 SaaS 產品或遊戲,人們期望免費才會使用。 使用者對 AI 的付費意願其實還是挺強的。

未來的話我可以提供一點想法。 我們在做數據標註流程中有一個關鍵步驟叫做預標註,就是我們訓練一個模型,讓模型來進行初級標註。 這一步非常有價值,可以節約很多人力成本。 我們將原始數據投入預訓練的模型進行預標註,然後進行半自動化的數據處理,最終手動進行精確標註。 預標註可以顯著提高效率,可能原本需要 100 人的工作,現在可能只需要 50 到 70 人。

另外預標註方面也涉及到 AI 和人的協作,通過你的反饋可以不斷提高模型的預標註能力,從而減少數據標註團隊的人數需求。 隨著 AI 和人的協作越來越好,原本 100 人的團隊可能只需要 30 人。 但是,這個過程有一個下限,即使 AI 協作做得非常好,仍然需要一定數量的人工進行最終的標註和審核。

在其他領域由於我不是數據科學家,我沒有親自清洗過數據或使用數據進行 SQL 查詢,所以我不清楚 AI 在這些領域具體能提供多大的説明。

Qiming Venture Partners-唐弈:我覺得長期內與 Web3 和 AI 是應該有一些交集的。 比如從意識形態的角度,Web3 的價值體系是可以結合到 AI 上的,很適合作為 bot 的賬號體系或者說價值轉化體系。 想像一下,一個機器人擁有自己的帳戶,可以通過其智慧部分賺錢,以及為維護其底層計算能力付費等。 這些概念有點科幻,實際應用可能還有很長的路要走。

第二個可能的方向驗證 AI 模型的輸出是否基於特定類別或特定的模型,或者特定的數據,並且是否可信。 這些領域在可信的 AI 模型中可能有一些用處。 從技術角度來看這些非常有趣,但是否有足夠的市場需求尚不確定。

另外一方面是 AI 的出現使數據內容生成變得泛濫和廉價。 對於數位作品等內容,難以確定其質量和創作者。 在這方面,數據內容的確權可能需要一個全新的體系,包括創作者和智慧體的角色。 但總的來說,這些問題可能仍然有待解決,而故事性的內容可能需要更長的時間來發展。 在短期內,我們應該繼續關注數據底層的品質,並期待模型能夠變得更強大。

另外在商業化方面,確實數據產品商業化非常難。 但是我認為從商業角度來看,AI 可能短期內不是解決數據產品商業化問題的解決方案。 商業化需要更多的產品化努力,而不僅僅是數據化能力。 因此,這些專案可能需要開發其他產品來實現商業化。

免責聲明:作為區塊鏈資訊平臺,本站所發佈文章僅代表作者及嘉賓個人觀點,與 Web3Caff 立場無關。 文章內的資訊僅供參考,均不構成任何投資建議及要約,並請您遵守所在國家或地區的相關法律法規。