如果只是换个包装,核心问题没解决,普通用户用不上,那跟耍猴有什么区别呢?

作者:七七嗜酒,Seven Research

封面:Photo by Shubham Dhage on Unsplash

我最近这两天在鼓捣 AI Agent, 想看看这些玩意儿到底能干点啥。同事推荐了两个产品,一个叫 Dify, 另外一个叫 Composio, 我粗略研究了一下,发现他们这两个产品各有自己的特色。

Dify 这个产品,估计有不少人听说过,玩起来类似有点像堆乐高,它提供了各种模块和工具,让开发者通过这些模块和工具,可以随意组合起来,搭建一套自己想要的 AI 应用,或者自动化的流程,听着挺美好,但实际上用起来就不一定了。

Composio 则是像是给你的 AI 准备的百宝箱,里面装满了各种工具和配件,从 GitHub、Notion、Gmail 等服务,这个是一个开源的项目。这个项目的开发者还很贴心的,准备了中文版本的文档供中文用户阅读,省去了中文用户进一步翻译文档。

可惜的是,这两个产品,作为一个非开发者来讲,入门门槛是有点高一些,对非开发者来讲实在不太友好。我第一次使用 Dify 的时候,里面的一些参数设置,看得我头疼,可以说对于普通用户来讲,非常不友好,需要去搜索教程一步步的按照教程走,而且还需要各种 API KEY, 折腾半天,我还是没搞定,直接摆烂了。

我突然发现,Web3 的一个 AI 应用——Myshell, 跟 Dify 类似,便开始始尝试,前段时间,他们也正好释放了一个产品预告,宣传说可以搭建一个跟 Crypto 相关的 AI 应用,比如可以交易、Mint NFT,本来我还挺期待的,于是我去他们群里问了一下,结果回答说目前还不行那个视频只是一个产品预告,现在只支持,让 AI 生成图片,然后 Mint NFT 这类操作。看来视频里的那些炫酷的功能,暂时还只是个概念。

在用 Myshell 的时候,感觉这产品搭建过程跟 Dify 一样,对新手太不友好了,缺乏一个用户引导的过程,尤其是在面对新的创作者来讲,没有 Step by Step 的介绍和引导,虽然有教程和文档,但对于非开发者来讲,还是有一定的门槛,尤其是对里面的各种变量参数的设置,以及对应的关系,是无法很好的理解。

我琢磨了一下午,照葫芦画瓢,创建一个模版,然后修改里面的一些参数,最后还是跑失败了。一是可能没有彻底理解这些变量和组件之间的关系,另外可能平台的服务有点问题,一直搜索不出对应的工具。

其实,我的需求很简单,就是搭建一个算命的机器人,用户提供生辰八字,然后帮用户算过去十年和未来十年的运势,运势算出来后,给用户提供一个选项:要不要求个平安符?如果用户选择 “是”,则会让 AI 生成一张类似于护身符的图片,然后再给用户提供一个选项:是否铸造 NFT? 如果用户选择 “是”,则会扣除用户一点费用,去铸造这个 NFT,并发送到他的钱包里。听起来挺简单吧,但实际操作起来,简直是噩梦。

对了,Myshell 还发了 Token,听说用户挺多的。但我体验下来,真没太明白它跟 Dify 的区别,除了把 Token 经济模型塞进去了,别的地方看不出啥本质不同的地方。搞 Web3 的,总喜欢弄点新概念,但如果只是换个包装,核心问题没解决,普通用户用不上,那跟耍猴有什么区别呢?

感觉 AI Agent 距离普通用户还很遥远,听说最近 Claude 提出了一个 MCP 概念,就是给 AI Agent 提供一套协议,让 AI Agent(AI 员工)进行协作,最终共同完成一个任务,听起来概念非常好,据说已经开始落地了,下次我有时间再去研究研究,这两天看看能否通过 Myshell 最终把我那个算命机器人搞出来。

免责声明:作为区块链信息平台,本站所发布文章仅代表作者及嘉宾个人观点,与 Web3Caff 立场无关。文章内的信息仅供参考,均不构成任何投资建议及要约,并请您遵守所在国家或地区的相关法律法规。