在深入研究 AI 和加密货币结合的领域数月后,对这个方向的理解更加深入。本文对早期观点和目前的赛道走向进行了对比分析

作者:Ian@Foresight Ventures

封面:Photo by Jigar Panchal on Unsplash

TL;DR

在深入研究 AI 和加密货币结合的领域数月后,对这个方向的理解更加深入。本文对早期观点和目前的赛道走向进行了对比分析,对赛道熟悉的朋友可以从第二个 section 开始看

  • 去中心化算力网络:面临市场需求挑战,特别强调去中心化的终极目的是降低成本。Web3 的社区属性和 token 带来了不可忽视的价值,但对于算力赛道本身来说还是一种附加值,而非颠覆性的改变,重点在于找到与用户需求结合的方式,而不是盲目将去中心化算力网络作为一种对于中心化算力不足的补充。
  • AI 市场:讨论了一个全链路金融化的 AI 市场的构想,社区和代币带来的价值和至关重要。这样的市场不仅关注底层算力和数据,还包括模型本身和相关应用。模型金融化是 AI 市场的核心要素,一方面吸引用户直接参与到 AI 模型的价值创造过程,另一方面给底层的算力和数据创造需求。
  • Onchain AI,ZKML 面临需求和供给的双重挑战,而 OPML 则提供了一种成本和效率更为平衡的方案。尽管 OPML 在技术上是一个创新,但它未必能解决链上 AI 面临的根本性挑战,即没有需求。
  • 应用层,大部分 web3 的 AI 的应用项目都过于 naive,AI 应用更合理的点在于增强用户体验和提高开发效率,或是作为 AI 市场中的重要一环。

一、AI 赛道回顾

在过去几个月我对 AI + crypto 这个话题进行了深度的研究,经过几个月的沉淀,很高兴自己在比较早的阶段洞悉到了一些赛道的走向,但也能看到有一些现在看来并不准确的观点。

这篇文章只讲观点不做 intro,会覆盖 web3 里 AI 的几个大方向并且展示之前和现在我对赛道的观点和分析。不同的视角可能会有不一样的启发,可以对比辩证地来看。

先来回顾一下在上半年定下的 AI + crypto 几个主要的方向:

1.1 分布式算力

在 “理性看待去中心化算力网络” 中,基于算力将成为未来最有价值的资源的大逻辑,分析了 crypto 能为算力网络赋予的价值。

虽然去中心化的分布式算力网络在 AI 大模型训练上的需求是最大的,但是也面临最大的挑战和技术瓶颈。包括需要复杂的数据同步和网络优化问题等。此外,数据隐私和安全也是重要的制约因素。虽然有一些现有的,技术能提供初步解决方案,但在大规模分布式训练任务中,由于计算和通信开销巨大,这些技术仍无法应用。显然去中心化的分布式算力网络在模型推理上更有机会落地,可以预测未来的增量空间也足够大。但也面临通信延迟、数据隐私、模型安全等挑战。和模型训练相比,推理时的计算复杂度和数据交互性较低,更适合在分布式环境中进行。

1.2 去中心化 AI 市场

在 “去中心化 AI Marketplace 的最佳尝试” 中,提到了一个成功的去中心化 AI marketplace 需要将 AI 和 Web3 的优势紧密结合,利用分布式、资产确权、收益分配和去中心化算力的附加值,降低 AI 应用的门槛,鼓励开发者上传和分享模型,同时保护用户的数据私有权,构建一个开发者友好,且满足用户需求的 AI 资源交易、共享平台。

当时的想法是(现在看来可能也不完全准确)基于数据的 AI marketplace 有更大的潜力。死磕模型的 marketplace 需要大量高质量模型的支撑,但早期平台缺乏用户基数和优质资源,使得优秀模型提供者的激励不足,难以吸引优质模型;而基于数据的 marketplace 通过去中心化,分布式地采集、激励层设计和数据所有权的保证,可以积累大量有价值的数据和资源,尤其是私域数据。

去中心化 AI marketplace 的成功依赖于用户资源的累积和强大的网络效应,用户和开发者可以从市场中获得的价值超过他们在市场之外能够得到的价值。在市场的早期,重点在于积累优质模型以吸引并保留用户,然后在建立起优质模型库和数据壁垒后,转向吸引和留住更多的终端用户。

1.3 ZKML

在 ZKML 的话题被广泛讨论之前就在 “AI + Web3 = ?” 中对链上 AI 的价值进行了讨论。

在不牺牲去中心化和 trustless 的基础上,onchain AI 有机会带领 web3 世界进入 “next level”。目前的 web3 就像是 web2 的早期阶段,还没有承接更广泛应用或者创造更大价值的能力。而 onchain AI 恰好为了提供一种透明的、trustless 的解决方案。

1.4 AI 应用

在 “AI + Crypto 出发聊聊 Web3 女性向游戏—HIM” 中,结合 portfolio 项目 “HIM” 解析了大模型在 web3 应用上带来的价值;什么样的 AI + crypto 能给产品带来更高回报?除了硬核地从基建到算法,开发链上 trustless 的 LLM,另一个方向是在产品中淡化推理的过程黑盒带来的影响,找到契合的场景来将大模型强大的推理能力落地。

二、当下的 AI 赛道分析

2.1 算力网络:想象空间很大但门槛高

算力网络的大逻辑依然没变,但是仍然面临市场需求的挑战,谁会需要效率和稳定性更低的解决方案?因此,以下这几点我认为需要想通:

去中心化是为了什么?

要是现在去问一个去中心化算力网络的 founder,他八成还是会告诉你我们的算力网络可以增强的安全性和抗攻击能力、提高透明度和信任、资源优化利用、更好的数据隐私和用户控制、抵御审查和干预……

这些都是 common sense,任何 web3 项目都能扯到抗审查、去信任、隐私等等,但我的观点是这些都不重要。仔细想一下,论安全性难道中心化的服务器不能做的更好?去中心化的算力网络本质上也没有解决隐私的问题,诸如此类的矛盾点还有很多。所以:一个算力网络去中心化终极目的一定是为了更低的成本。去中心化的程度越高,使用算力的成本越低。

所以,从根本上看 “利用闲置算力” 更多是一种长远的叙事,而一个去中心化算力网络能不能做成,我认为很大程度上取决于他有没有想明白以下几点:

Web3 提供的价值

一套巧妙的 token 设计以及随之而来的激励/惩罚机制显然是去中心化社区提供的强有力 value add。相比传统互联网,token 不仅作为交易媒介,和 smart contract 相辅相成能让 protocol 实现更复杂的激励和治理机制。同时,交易的公开透明、成本的降低、效率的提升都得益于 crypto 带来的价值。这种独特的价值为激励贡献者提供了更多灵活性和创新空间。

但同时也希望可以理性看待这种看似合理的 “契合”,对于去中心化算力网络来说,Web3 和区块链技术带来的这些价值从另一个角度看仅仅只是 “附加值”,而不是根本性的颠覆,并不能改变整个网络的基本工作方式和突破现在的技术瓶颈。

简而言之,这些 web3 的价值在于增强了去中心化网络的吸引力,但不会完全改变其核心结构或运作模式,如果希望去中心化网络在 AI 浪潮里真正占据一席之地,仅仅靠 web3 的价值是远远不够的。因此,就像后面会提到的,合适的技术解决合适的问题,去中心化算力网络的玩法绝不是单纯地去解决 AI 算力短缺的问题,而是给这个沉寂已久的赛道一个新的玩法和思路。

可能是像 pow 挖矿或者存储挖矿一样,把算力作为一种资产进行货币化。在这种模式下,算力的提供者可以通过贡献自己的计算资源来获取代币作为报酬。吸引力在于它提供了一种直接将计算资源转换为经济收益的方式,从而激励更多的参与者加入网络。也可能是基于 web3 创造一个消耗算力的市场,通过将算力的上游金融化(比如模型),开辟出能接受不稳定、且更慢的算力的需求点。

想明白怎么和用户的实际需求结合,毕竟用户和参与者的需求不一定只是高效的算力,“能赚到钱” 永远是最有说服力的动力之一。

去中心化算力网络的核心竞争力是价格

如果一定要从实际价值上讨论去中心化算力,那 web3 带来最大的想象空间就是有机会被进一步压缩的算力成本。

算力节点的去中心化程度越高,单位算力的价格越低。从以下几个方向可以推演:

  1. token 的引入,支付给节点算力提供者的从现金变为协议的原生代币,这从根本上降低了运营成本;
  2. 在准入上的 permissionless 以及 web3 强大的社区效应直接促成了一种市场驱动的成本优化,更多个人用户和小型企业可以利用现有的硬件资源加入网络,算力供应增加,市场上算力的供应价格下降。在自治和社区管理模式下。
  3. 协议所创造的开放的算力市场会促进算力提供者的价格博弈,从而进一步降低成本。

Case: ChainML

简单来说:ChainML 是一个为 inference、finetuning 提供算力的去中心化平台。从短期看,chainml 会实现基于开源的 AI 代理框架 Council,通过 Council 的尝试(一个 chatbot,可以 integrate 到不同 application 中)为去中心化计算网络带来需求的增长。从长期看,chainml 会是一个完整的 AI + web3 平台(后面会详细分析),其中就包括模型市场和算力市场。

我认为 ChainML 的技术路径规划非常合理,之前提到的问题他们想的也很明白,去中心化算力的目的一定不是和中心化的算力相提并论,给 AI industry 提供充足的算力 supply,而是逐步降低成本让合适的需求方接受这种品质更低的算力来源。那么,在项目初期,在协议无法获取大量去中心化算力节点的情况下,重点就是找到一个稳定且高效的算力来源,因此,从产品路径看,应当是先从中心化的方式做起,在早期阶段就把产品链路跑通,并且通过强大的 bd 能力开始积累客户,拓展和据市场,然后逐步将中心化算力的提供者分散到更成本的小公司,最后把算力节点大范围地铺开。这就是 chainml divide and conquer 的思路。

从需求端的布局看,ChainML 构建了一个中心化的基础设施协议的 MVP,设计理念是可移植的。并且从今年 2 月开始就在和客户一起运行这个系统,在今年 4 月开始在生产环境中使用。目前正 Google Cloud 上运行,但基于 Kubernetes 和其他开源技术,很容易移植到其他环境(AWS、Azure、Coreweave 等)。后续会逐步去中心化这个协议,分散到小众云,然后最后是提供算力的矿工。

2.2 AI 市场:想象空间更大

这个 sector 叫 AI markerplace 多少有点限制了想象空间。严格意义上来说,一个真正具备想象空间的”AI 市场” 应该是一种将模型全链路金融化的中间平台,涵盖从底层的算力和数据,到模型本身和相关的应用。之前提到去中心化算力在早期的主要矛盾是如何创造需求,而一个闭环的将 AI 全链路金融化的市场正好有机会诞生出这类需求。

大概是这样:

一个 web3 加持下的 AI 市场以算力和数据为底层,吸引开发者通过更有价值的数据搭建或者微调模型,进而发展出相应的基于模型的应用,这些应用和模型在开发和使用的同时也为算力创造了需求。在代币和社区的激励下,基于 bounty 的实时数据采集任务或者常态化的对于贡献数据的激励都有机会扩充并且扩大该市场中数据层的独特优势。同时,应用的普及也返回给数据层更多有价值的数据。

社区

除了之前提到的 token 带来的价值,社区无疑是 web3 带来的最大增益之一,是推动平台发展的核心动力。社区和 token 的加持使得贡献者和贡献内容的质量有机会超过中心化机构,比如,数据多样性成就是这类平台的一个优势,这对于构建准确、无偏见的 AI 模型是至关重要的,同时也是目前数据方向的瓶颈所在。

整个平台的核心我认为就在于模型,我们在很早的时候就意识到,一个 AI marketplace 是否成功取决于是否存在高质量的模型,以及开发者有什么动力来一个去中心化的平台提供模型?但我们似乎也忘记思考了一个问题,拼基建不如传统平台硬,拼开发者社区不如传统平台成熟,拼声誉也没有传统平台的先发优势,那么相比传统 AI 平台庞大的用户基数和成熟的基建,web3 的项目只能弯道超车。

答案可能就在 AI 模型金融化

  • 模型可以被当作为一种商品,将 AI 模型视为可投资的资产是可能是 Web3 和去中心化市场的一个有意思的创新。这种市场允许用户直接参与到 AI 模型的价值创造过程中,并从中受益。这种机制也鼓励了对更高质量模型的追求和社区的贡献,因为用户的收益直接与模型的性能和应用效果相关联;
  • 用户可以通过对模型进行质押来投资,引入收益分成的机制一方面激励用户选择和支持有潜力的模型,为模型开发者创造更优秀的模型提供了经济激励。另一方面,对于质押者来说最直观的评判模型的标准(特别是对于图像生成类的模型)就是多次进行实测,那么这就为平台的去中心化算力提供了需求,这可能也是之前提到的 “谁会想用更低效更不稳定的算力?” 的出路之一。

2.3 Onchain AI:OPML 弯道超车?

ZKML:需求和供给两端双双踩雷

可以肯定的是 on-chain AI 一定是一个充满想象空间,并且值得深入研究的方向。链上 AI 的突破能为 web3 带来前所未有的价值。但同时,ZKML 极高的学术门槛和对底层基建的要求确实不适合大多数初创公司死磕。大多数项目也不一定需要融入 trustless LLM 的支持才能达成自身价值的突破。

但并不是所有 AI 模型都需要搬到链上用 ZK 来做 trustless,就像大多数人并不关心 chatbot 是怎么对 query 进行推理并给出结果的,也不在意使用的 stable diffusion 是否是某个版本的模型架构或者特定的参数设置。在大多数场景中,大多数用户关注的是模型是否能给一个满意的 output,而不是推理的过程是否 trustless 或者透明。

如果 proving system 并没有带来百倍的 overhead 或者更高的推理成本,或许 ZKML 还有一战之力,但在高昂的链上推理成本和更高的成本面前,任何需求方都有理由质疑 Onchain AI 的必要性。

从需求端看

用户在乎的是模型给出的结果是不是 make sense,只要结果合理,ZKML 带来的 trustless 可以说一文不值;试想一下其中一个场景:

  • 如果一个基于神经网络的交易机器人每个周期都给用户带来百倍的收益,谁还会去质疑算法是否中心化或者是否可验证?
  • 同样的,如果这个 trading bot 开始给用户亏钱了,那项目方更应该思考的是如何提升模型的能力而不是把精力和资本花在让模型可验证上。这就是 ZKML 需求中的矛盾所在,换句话说模型的可验证在很多场景下并不从根本上解决人们对 AI 的质疑,就有点南辕北辙的意思。

从供给端看

开发足以支撑大预言模型的 proving system 任重而道远,从现在头部项目的尝试看,几乎看不到大模型上链的一天。

参考我们之前关于 ZKML 的文章,从技术上看 ZKML 的目标是将神经网络转化成 ZK 电路,难点在于:

  1. ZK 电路不支持浮点数;
  2. 大规模的神经网络难以转换。

从当前进展看:

  1. 最新的 ZKML 库支持一些简单的神经网络 ZK 化,据称能将基础的线性回归模型上链。但现存的 demo 很少。
  2. 理论上最大能支持~100M 的参数,但仅存于理论。

ZKML 的发展进度并没有达到预期,从目前赛道头部项目 modulus lab 和 EZKL 发布的 proving system 的进度看,都能将一些简单的模型转化成 ZK 电路做模型的上链或推理证明上链了。但这还远远没有达到 ZKML 的价值所在 not event close,并且技术的瓶颈似乎也没有核心的动力去突破,一个严重缺乏需求的赛道从根本上无法获得学术界的关注,也就意味着更难以做出优秀的 poc 来吸引/满足仅存的需求而这可能也是杀死 ZKML 的死亡螺旋。

OPML:是过渡还是终局?

OPML 和 ZKML 的差异在于 ZKML 证明了完整的推理过程,而 OPML 会在推理受到挑战时重新执行部分推理过程。很显然,OPML 解决的最大的问题就是成本/overhead 过高,这是一种非常务实的优化。

作为 OPML 的开创者,HyperOracle 团队在 “opML is All You Need: Run a 13B ML Model in Ethereum” 中给出了 one-phase 到 multi-phase opML 的架构和进阶过程:

  • 构建一个用于链下执行和链上验证的虚拟机,确保离线 VM 和链上智能合约中实现的 VM 之间的等效性。
  • 为了确保 AI 模型在 VM 中的推理效率,实现一个专门设计的轻量级 DNN 库(不依赖于像 Tensorflow 或 PyTorch 这样的流行机器学习框架),同时团队也提供了一个可以将 Tensorflow 和 PyTorch 模型转换为这个轻量级库的脚本。
  • 通过交叉编译将 AI 模型推理代码编译成 VM 程序指令。
  • VM image 通过 Merkle tree 来管理。只有代表 VM 状态的 Merkle root 会被上传到链上智能合约。

但显然这样的设计有一个关键缺陷,就是所有计算必须在虚拟机内执行,这阻止就阻碍了利用 GPU/TPU 加速以及并行处理,局限了效率。因此引入 multi-phase opML。

  • 只有在 final phase 中,计算在 VM 进行。
  • 在其他阶段,状态转换的计算发生在 native 的环境中,这样就利用了比如 CPU、GPU、TPU 的能力,并支持并行处理。这样的做法减少了对 VM 的依赖,显著提高了执行性能,达到与原生环境相当的水平。

Reference: https://mirror.xyz/hyperoracleblog.eth/Z__Ui5I9gFOy7-da_jI1lgEqtnzSIKcwuBIrk-6YM0Y

LET’S BE REAL

有观点认为 OPML 是一种实现全面 ZKML 前的一个过渡,但更现实的说不如把它当作一种 Onchain AI 基于成本结构和落地预期的取舍,或许 ZKML 全面实现的一天永远不会到来,至少我对此持悲观的态度,那么 Onchain AI 的 hype 最终还是要面对最现实的落地和成本,那么 OPML 可能就是 Onchain AI 的最佳实践,就像是 OP 和 ZK 的生态也从来不是替代的关系。

虽然但是,不要忘记了,之前需求的短板仍然存在,OPML 基于成本和效率的优化并不从根本上解决 “既然用户更在意结果的合理性,为什么要把 AI 搬到链上做成 trustless” 南辕北辙的问题,透明、所有权、去信任,这些 buff 叠加在一起确实很花里胡哨,但用户真的在乎吗?相比之下,价值的体现应该是在模型的推理能力上。

我认为这种对成本的优化从技术上是一个创新且 solid 的尝试,但从价值上看更像是一种蹩脚的圆场;

或许 Onchain AI 这个赛道本身就是在拿着锤子找钉子,但这也没错,一个早期行业的发展就是需要不断探索跨领域技术的创新结合,在不断磨合中找到最佳的契合点,错的从来都不是技术的碰撞和尝试,而是缺乏独立思考的盲目跟风。

2.4 应用层:99% 的缝合怪

不得不说 AI 在 web3 应用层的尝试确实前赴后继,好像大家都在 fomo,但其中 99% 的 integration 还是就停留在 integration 吧,没必要借着 gpt 的推理能力映射项目本身有多大价值。

从应用层看,大致有两种出路:

  1. 借助 AI 的能力提升用户体验,提升开发效率:这种情况下 AI 并不会是核心亮点,更多时候是作为一种幕后工作者默默付出,甚至对用户无感;举个例子,web3 游戏 HIM 的团队对于游戏内容、AI、crypto 的结合想很聪明,抓住了契合度高,最能产生价值的点,就是一方面利用 AI 作为生产价值工具,提升开效率和质量,另一方面通过 AI 的推理能力提升用户的游戏体验,AI 和 crypto 确实带来了非常重要的价值,但根本上还是利用了将技术工具化的手段,项目真正的优势和核心仍然是团队对游戏开发的能力
  2. 和 AI marketplace 结合,成为整个生态中面向用户的重要一环。

三、最后…

如果真的有什么需要强调或者总结的:AI 仍然是 web3 最值得关注也是机会最大的赛道之一,这个大逻辑一定不会变;

但我认为最值得关注的是 AI marketplace 的玩法,从根本上看这种平台或者 infra 的设计是符合价值创造的需求以及满足各方利益的,宏观来说,在模型或者算力本身以外创造出了一种 web3 特有的价值捕获的方式就足够有吸引力,同时,这也允许用户用一种独特的方式直接参与到 AI 的浪潮中。

或许再过三个月我又会推翻我现在的想法,所以:

以上只是我关于这个赛道很 real 的观点,真的不构成任何投资建议!

Reference

“opML is All You Need: Run a 13B ML Model in Ethereum”: https://mirror.xyz/hyperoracleblog.eth/Z__Ui5I9gFOy7-da_jI1lgEqtnzSIKcwuBIrk-6YM0Y

免责声明:作为区块链信息平台,本站所发布文章仅代表作者及嘉宾个人观点,与 Web3Caff 立场无关。文章内的信息仅供参考,均不构成任何投资建议及要约,并请您遵守所在国家或地区的相关法律法规。