大語言模型(LLM)將如何從應用層面助力區塊鏈?

作者:Yiping,IOSG Ventures

本文為 IOSG 原創內容,僅做行業學習交流之用,不構成任何投資參考。 如需引用,請註明來源,轉載請聯繫 IOSG 團隊獲取授權及轉載須知。

歡迎來到我們的大語言模型(LLM)與區塊鏈研究系列的第二篇文章。 在上一篇文章中,我們從技術層面討論了如何將 LLM 與區塊鏈技術整合的,以及為何 LLM 框架非常適合區塊鏈領域。 我們還勾勒了未來將 LLM 與區塊鏈融合的潛在路徑。

在這篇文章中,我們將採用更加實際的方法,深入探討八個特定的應用領域,我們相信這些應用將極大地改變區塊鏈用戶體驗。 更加令人興奮的是,我們預測這些突破性的應用將在接下來的一年內變為現實。 請加入我們,一同揭示區塊鏈交互的未來。 以下是我們將要討論的八個應用的簡要概述:

1. 將內置的人工智慧/LLM 功能整合到區塊鏈中

2. 利用 LLM 分析交易記錄

3. 運用 LLM 增強安全性 4. 利用 LLM 編寫代碼

5. 使用 LLM 閱讀代碼

6. 借助 LLM 協助社區

7. 實施 LLM 跟蹤市場

8. 應用 LLM 分析專案

將內置的人工智慧/LLM 功能整合到區塊鏈中

區塊鏈將內置人工智慧功能和模型。 開發人員可以訪問人工智慧函數,在鏈上執行分類、回歸、文本補全和 AIGC 等簽名式 ML 任務。 開發者可以通過智慧合約調用這些人工智慧功能。

圖片

有了這些內置功能,開發人員就能為他們的智慧合約賦予智慧和自主權。 分類、回歸和 AIGC 是典型的人工智慧任務。 讓我們看看這些功能在區塊鏈領域的應用以及幾個示例專案。

分類

分类可用于确定地址是机器人还是真人。这可以改变当前的 NFT 销售情况。分类还可以提高 DeFi 生态系统的安全性。DeFi 智能合约可以过滤恶意交易,防止资金流失。

回归(Regression)

回归分析可以用于预测,应用于基金和资产管理。Numer.ai 已经使用人工智能来帮助他们管理资金。Numer 提供高质量的股市数据,数据科学家在这些数据的基础上进行工作,并应用机器学习来预测股市。

AIGC

许多 NFT 项目都试图构建一个 IP 宇宙。然而,它们有限的内容无法支撑一个宇宙。如果我们可以在链上使用 AIGC,以相对较低的成本输出无数具有类似的标志性品牌风格的内容。模型可以输出文本、插图、音乐、声音甚至视频。这大大扩展了 IP 宇宙的规模。社区参与者可以共同对模型进行微调,以满足他们的期望。微调过程也让社区有参与感。

Botto 使用 AIGC 模型来生成艺术内容。社区对他们最喜欢的图像进行投票,以共同微调 AIGC 模型。

图片

如果我们将区块链视为一个数据库,我们还发现 Databend 将内置的人工智能功能整合到他们的数据库中。他们提供以下功能:

  • ai_embedding_vector:为文本文档生成嵌入向量。
  • ai_text_completion:基于给定的提示生成文本补全。
  • cosine_distance:计算两个嵌入向量之间的余弦距离。
  • ai_to_sql:将自然语言指令转换为 SQL 查询。

为区块链提供 AI 能力

我们知道,一些项目正在为区块链提供 AI 能功能。

Giza 正致力于 ZKML 方面的工作。它在链外生成推理证明,并在链上进行验证。它现在支持与以太坊虚拟机兼容的区块链以及 StarkNet。Giza 最近宣布与 Yearn.finance 达成了合作伙伴关系,Yearn 将利用 Giza 的人工智能功能来提升其风险评估能力。  

图片

Modulus Labs 也在类似的方向上进行工作。他们更加努力地改进证明系统,以生成用于人工智能的高性能电路。他们发布了诸如国际象棋人工智能和以太坊价格预测人工智能等演示。他们的新演示项目 zkMon 是全球第一个经过零知识证明的生成对抗网络 NFT 收藏品。

利用 LLM 分析交易記錄

分析交易記錄通常由特定的應用程式(如 Debank)完成。 人工手動分析交易記錄很困難。 手動分析涉及數據收集、數據清洗和數據分析,這要求使用者需要具備編碼能力。 因為 LLM 能分析和可視化數據的能力,我們現在有了一種新的方法。  通過 LLM,我們可以根據定製需求分析鏈上數據。 我們可以分析勝率、性能比,或者任何我們想要了解的資訊。

RSS3 開發了一個名為 Web3 用戶活動的 ChatGPT 外掛程式,以致力於向這個方向發展。 用戶可以輸入錢包位址、ENS 或 Lens 來查詢鏈上活動。 該外掛程式將以人類可讀的方式輸出交易資訊。 然而可惜的是它不能執行複雜的查詢,比如有多少 Azuki 持有者,哪些智慧合約最熱門等。 用戶還應該注意,外掛程式提供的地址和標籤不一定準確。

圖片

DeFiLlama 也發佈了一個 ChatGPT 外掛程式。 使用者可以用自然語言查詢在 DeFiLlama 上可用的任何數據。 它還可以執行簡單的篩選和排序操作:

圖片

Dune 也在將 GPT 整合到其產品中,以實現以下功能:

  • 查詢釋義:使用 LLM 解釋查詢
  • 查詢翻譯:使用 LLM 將其他 SQL 語言翻譯為 DuneSQL
  • 自然語言查詢:使用戶可以使用自然語言編寫查詢
  • 搜索:使用 LLM 改進搜尋結果
  • 嚮導知識庫:使用戶能與文檔交流的聊天機器人

利用 LLM 增強安全性

由於具備邏輯和推理能力,LLM 可以用於過濾一些惡意交易,充當智能合約的防火牆。 以下是一個具體的範例,展示如何阻止機器人活動:

在輸入位址后,LLM 可以通過第三方外掛程式獲取所有的交易數據,隨後分析這些交易記錄,並擬出位址是機器人的可能性。 這個功能可以嵌入到不歡迎機器人的 Dapps 中,比如 NFT sales。

以下是一個通過 ChatGPT 的簡單示例。 ChatGPT 透過 RSS3 開發的 Web3 使用者活動外掛程式檢索帳戶的交易記錄,然後分析這些交易記錄,並輸出帳戶是機器人的可能性。

圖片

如果我們輸入更多的交易記錄,並在與機器人相關的數據集上對 LLM 進行微調,我們就可以獲得更準確的結果。 以下是這類應用的一個示例工作流程。 我們還可以添加緩存和資料庫層,以提高回應速度並降低成本。

利用 LLM 編寫代碼

LLM 在開發中被廣泛用於幫助開發人員更快、更好地編寫代碼。 根據開發人員的指示,LLM 可以為他們生成代碼。 目前,開發人員仍然需要為 LLM 提供詳細的指示。 LLM 很難自動生成整個項目的代碼。

一些流行的用於代碼的 LLM 模型包括 StarCoder、StarCoder+、Code T5、LTM、DIDACT、WizardCoder、FalCoder-7B 和 MPT30B。

所有這些模型都可以用於編寫智能合約,但它們可能並未專門在智慧合約數據上進行訓練。 它們仍有改進的空間。

目前,在 HuggingFace 上只有一個與智慧合約相關的數據集可用。 它是更狡猾的被審計的智能合約集,包含 11.3 萬個智能合約。 它可用於文字分類、文本生成和漏洞檢測等任務。

圖片

與協助開發工具相比,自動代碼生成可能更具有前景。 自動代碼生成適用於智慧合約,因為智慧合約相對較短且相對簡單。 LLM 在區塊鏈領域中有幾種方式可以幫助開發人員自動生成代碼。

測試

首先,LLM 可以為編寫良好的智慧合約生成測試。 如 Codium 可以自動生成已編寫項目的測試。 Codium 目前支援 JS 和 TS。 Codium 首先理解代碼庫,分析每個函數、文檔字串和註釋。 然後,Codium 將代碼分析作為註釋寫回檔,並輸出一個測試計劃。 用戶可以選擇他們喜歡的測試,Codium 將生成所選的測試代碼。

圖片

其他輔助工具也支援為選定的功能生成測試。

圖片

我們可以按照類似的步驟在 GPT-4 上複製類似的功能。

我們首先要求進行代碼分析,是因為我們希望 LLM 在這個任務上花費更多的時間。 LLM 並不知道哪些任務是困難的。 它會在每個標記上投入相同的計算能力。 這可能會導致在複雜任務上產生不準確的結果。 基於這些特點,我們要求進行代碼分析。 這樣,LLM 將花費更多的標記/時間來思考這些任務,並輸出更高品質的結果。 這種方法也被稱為「思維鏈」。。

為了讓它適用於更長的智慧合約,我們需要一個具有更大上下文的 LLM,或者採用一些工程設計來保留記憶。

生成輔助腳本

其次,我們可以使用 LLM 自動生成一些輔助腳本,例如部署腳本

部署腳本可以減少在手動部署過程中出現的潛在錯誤。 這個想法與自動生成測試非常類似。

自動分叉

在牛市中會出現許多分叉項目,團隊會從其原始代碼庫中進行少量代碼的更改。 這將是 LLM 的一個很好的用例:LLM 可以幫助開發人員根據團隊的需求自動修改代碼。 通常只需要更改代碼的特定部分。 這對於 LLM 來說相對容易實現。 自動生成代碼

如果我們再邁進一步,LLM 是否可以根據開發人員的需求自動生成智能合約呢? 與其他使用 JS、Rust 和 Python 編寫的複雜軟體相比,智慧合約相對較短且相對簡單。 智慧合約沒有太多外部庫。 **對 LLM 來說,弄清楚如何編寫智能合約**相對更容易。

我們已經看到了一些自動代碼生成方面的進展。 GPT-engineer 是其中之一的先驅。 它會滿足使用者的需求,並解答 LLM 的任何疑問,然後開始編碼。 代碼還包括一個可以運行整個項目的腳本。 GPT-engineer 可以自動為開發人員啟動專案。

使用者輸入他們的需求后,GPT-engineer 會分析需求並要求進行一些澄清。 在收集所有必要信息之後,GPT-engineer 將首先輸出程序的設計,包括此任務所需的核心類、函數和方法。 然後,GPT-engineer 將為每個檔生成代碼。

通過類似這樣的提示,我們可以生成一個計數器智能合約。

智慧合約可以通過編譯並按預期工作。

因為 GPT-engineer 最初是為 Python 設計的,所以在生成與 Hardhat 相關的代碼時存在一些問題。 GPT-engineer 不知道 Hardhat 的最新版本,有時會生成過時的測試和部署腳本。

如果我們的代碼有 bug,我們可以將代碼庫和控制台錯誤日誌提供給 LLM。 LLM 可以不斷修改代碼,直到代碼能夠成功運行。 我們看到了類似 **[flo](https://flocli.vercel.app/)** 這樣的專案正在朝這個方向發展。 目前,flo 僅支援 JS。

如果我們想要提高智慧合約生成的準確性,我們可以通過一些新的提示來改進 GPT-engineer。 我們可以採用測試驅動開發的方式,要求 LLM 確保程式通過一定的測試,從而更好地約束生成的程式。

利用 LLM 閱讀代碼

由於 LLM 可以很好地理解代碼,我們可以使用 LLM 來編寫開發者文檔。 LLM 還可以跟蹤代碼變化,以更新文件。 我們在上一篇研究報告《Exploring Developer Experience on ZKRUs: An In-Depth Analysis》的末尾討論過這種方法。

閱讀文檔是傳統方式,而與代碼交流是一種新的方法。 使用者可以就代碼提出任何問題,LLM 會回答用戶的問題。 LLM 可以為開發人員解釋代碼,幫助他們快速理解鏈上的智能合約。 LLM 還可以幫助沒有代碼經驗的人理解智能合約。

我們在 Web2 世界中已經看到了這種趨勢。 許多代碼協助工具都具備代碼解釋功能。

Etherescan 也展示了其新功能,使用者可以與代碼進行交流,利用 LLM 的能力。

圖片

在能理解代碼的情況下,審計會怎麼改變?  在論文《do you still need a manual smart contract audit》的實驗中,LLM 在識別漏洞方面達到了 40% 的命中率,優於隨機基準。 然而,他們也有很高的誤報率。 作者指出,適當的提示是關鍵。

除了提示外,還有以下原因限制了其應用:

  • 當前的 LLM 沒有專門為這個目的進行訓練。 訓練數據可能不涉及智慧合約代碼庫和相應的審計報告。
  • 通常最嚴重的漏洞是由不同功能組成的邏輯問題。 LLM 目前受到令牌數量的限制。 LLM 無法解決具有很長上下文並需要邏輯能力的問題。

這些問題並不難解決。 大型審計公司擁有數千份審計報告,可以用來微調 LLM。 帶有大令牌限制的 LLM 正在出現。 Claude 有 10 萬個令牌限制。 新發佈的 LTM-1 具有令人矚目的 500 萬個令牌限制。 通過解決這兩個問題的努力,我們可能會看到 LLM 將可以更好地識別漏洞。 LLM 可以協助審計師並加速審計流程。 這可能會逐步發展。 以下是可能的發展軌跡:

1. 幫助審計師組織語言並格式化報告。 這可以確保在同一審計公司下的語言一致性。 通常不同的小組可能有不同的偏好詞彙。

2. 幫助審計師識別和驗證潛在的漏洞。

3. 自動生成審計草案報告。

利用 LLM 幫助社區

治理是社區的關鍵部分。 社區成員有權為自己喜歡的提案投票。 這些提案將塑造產品的未來。

對於重要的提案,會有許多背景資訊和社區討論。 在投票之前,社區成員很難全都理解這個背景。 LLM 可以幫助社區成員快速瞭解他們的選擇對未來的影響,並幫助他們投票。

問答機器人是另一個潛在的應用。 我們已經看到基於項目文檔的問答機器人。 我們可以進一步建立一個更大的知識資料庫。  我們可以插入不同的媒體和來源,比如演示文稿、播客、GitHub、Discord 聊天和 Twitter Space。 問答機器人不僅存在於文檔搜索欄中,還可以在 Discord 上為社區成員提供即時支援,或者在 Twitter 上傳播專案的願景並回答任何問題。

AwesomeQA 目前正在朝這個方向發展。 它實現了三個功能:

  • 使用 ChatGPT 集成來回答社區成員的問題
  • 基於社區成員的消息獲得數據驅動的見解,比如 FAQ 分析
  • 發現哪些消息是重要的,比如未解決的問題

目前問答機器人面臨的難點之一是如何準確地從向量資料庫中獲取相關上下文,並將上下文提供給 LLM。 例如,如果使用者要求對多個元素進行多個特徵的帶有過濾條件的查詢,機器人可能無法從向量資料庫中檢索相關的上下文。

更新向量資料庫是另一個問題。 目前的解決方案是重新構建向量資料庫,或者通過命名空間來更新向量資料庫。 向嵌入添加命名空間類似於在數據上附加標籤。 這可以幫助開發人員更容易地找到和更新相應的嵌入。

利用 LLM 追蹤市場

市場變化很大,每天都會發生許多事情。 例如 KOL(關鍵意見領袖)發佈新的想法和思考,新聞簡報和產品電子郵件湧入您的郵箱。 LLM 可以為您選擇最重要的想法和新聞。 它還可以總結內容以縮短您的閱讀時間,並説明您跟上市場動態

minmax.ai  致力於新聞領域。 他們為特定主題的最新新聞提供摘要,還提供關於該主題的情感分析。

Boring reports  從新聞中剔除聳動內容,專注於重要細節,幫助讀者做出正確決策。

機器人諮詢是當前最熱門的領域之一。 LLM 可以推動機器人諮詢的使用。 LLM 可以提供交易建議,幫助用戶根據股票資訊作為背景管理投資組合

像 Numer.ai 這樣的專案使用 AI 來預測市場並管理基金。 還有由 LLM 管理的投資組合。 用戶可以在 Robinhood 上關注這些投資組合。

Composer  帶來了具有 AI 的交易演算法。 AI 基於使用者的見解構建特定的交易策略。 然後 AI 將自動對這些交易策略進行回測。 如果使用者對策略滿意,Composer 可以自動為使用者執行這些策略。

利用 LLM 分析專案

分析專案通常涉及閱讀大量的材料和撰寫長篇研究論文。 LLM 可以閱讀和撰寫短段落。 如果我們可以擴展其對長段落的能力,這是否意味著 LLM 可以以某種方式輸出一些專案研究呢? 很可能是的。  我們可以輸入白皮書、文檔或活動演示,讓 LLM 分析專案和 founder。  受到令牌數量的限制,我們可以首先寫出論文的大綱,然後根據其獲取的資訊更新優化每個部分。

像 BabyAGI 這樣的項目已經在這個方向上取得了進展。 以下是 BlockAGI 的示例輸出,它是 BabyAGI 的一個變種。

LLM 也可以基於 Twitter 和公開演講來分析 founder 的個性。 例如,Tweet 分析器可以獲取最近的推文,並使用 LLM 來分析個人特質。

结论

这些是 LLM 在不久的将来可以帮助区块链社区的八个具体方向:

1. 将内置的 AI/LLM 功能整合到区块链中。

2. 利用 LLM 来分析交易记录。

3. 使用 LLM 增强安全性。

4. 利用 LLM 编写代码。

5. 使用 LLM 阅读代码。

6. 利用 LLM 协助社区。

7. 使用 LLM 跟踪市场。

8. 应用 LLM 来分析项目。

LLM 可以惠及加密领域的所有成员,包括项目所有者、分析师和工程师。创始人可以使用 LLM 自动化文件和问答等任务。工程师可以使用 LLM 更快、更安全地编写代码。分析师可以更轻松地研究项目。

从长远来看,我们还找到了在 GameFi 领域应用 LLM 的潜在机会。LLM 可以在游戏中生成更有趣的任务,并在游戏中扮演不同的角色。游戏中的世界会感觉更加真实和有趣。NPC 将根据玩家的动作进行动态反应。任务将根据用户的解决方式具有更多结局。

LLM 可以集成到現有專案中,但也為新進入者提供了機會。 例如,在鏈上數據分析領域已經有一些頂尖玩家。 Dune 可以整合 LLM 來改善用戶體驗。 然而,LLM 也為新進入者提供了機會。 這些新進入者可以將 LLM 置於其產品設計的核心位置。 這些以 AI 為先導、以 AI 為中心的創意產品可能會為鏈上數據分析領域帶來新的競爭。

LLM 在 Web2 和 Web3 世界中的用途有重合之處,但它們可能會以不同的方式實現產品。  因為我們在 Web3 世界中使用的數據與 Web2 世界中的數據不同。 LLM 的知識庫在 Web2 和 Web3 中也可能不同。 Web3 數據涉及區塊鏈、代幣價格、推文、專案和研究成果。 因此,Web2 和 Web3 需要不同的 LLM 來為終端使用者提供服務。

由於 LLM 的繁榮,我們看到了 AIxBlockchain 的日益流行。 然而,很多 AIxBlockhain 在短時間內並不實際。  區塊鏈和零知識證明無法為一些複雜模型提供大規模的計算能力來進行訓練和推理。  小模型無法解決複雜的任務。 更實際的方法是在區塊鏈領域應用 LLM。 LLM 最近取得了比其他 AI 主題更大的進展。  將 LLM 和區塊鏈結合起來更加合理。

LLM 社區正在努力改進令牌限制和提高響應準確性。 留給區塊鏈社區的是數據源和數據管道。 經過清洗的數據可以用於微調 LLM,以提高在區塊鏈環境下的準確性。 數據管道可以將更多的區塊鏈相關應用集成到 LLM 中,並開發更多的加密特定代理。

免責聲明:作為區塊鏈資訊平臺,本站所發佈文章僅代表作者及嘉賓個人觀點,與 Web3Caff 立場無關。 文章內的資訊僅供參考,均不構成任何投資建議及要約,並請您遵守所在國家或地區的相關法律法規。