Time:2023-05-02 Click:101
自从 ChatGPT 和 GPT-4 推出后,有很多关于人工智能如何革新一切,包括 Web 3 的内容。多个行业的开发者报告称,通过利用 ChatGPT 作为共同驾驶员来自动化任务,如生成样板代码、进行单元测试、创建文档、调试和检测漏洞等,可以显著提高生产效率,范围从 50% 到 500% 不等。虽然本文将探讨人工智能如何实现新的有趣的 Web 3 用例,但其主要关注点是 Web 3 和人工智能之间的互利关系。很少有技术有能力显著影响人工智能的发展方向,而 Web 3 是其中之一。
尽管其具有巨大的潜力,但当前的人工智能模型面临着一些挑战,如数据隐私、专有模型的执行公正性以及创造和传播可信的虚假内容的能力等。一些现有的 Web 3 技术在应对这些挑战方面具有独特的优势。
Web 3 可以帮助 AI 的一个领域是通过协作创建专有数据集进行机器学习(ML)训练,即使用 PoPW 网络进行数据集创建。大规模数据集对于准确的 ML 模型至关重要,但在需要使用私有数据(如使用 ML 进行医学诊断)的用例中,其创建可能成为瓶颈。由于患者数据隐私的关注,医疗记录的访问是训练这些模型的必要条件,但患者可能因隐私问题而不愿意分享他们的医疗记录。为了解决这个问题,患者可以通过可验证的方式对其医疗记录进行匿名化,以保护他们的隐私同时仍然可以用于 ML 训练。
但是,匿名化的医疗记录的真实性是一个问题,因为虚假数据会严重影响模型的性能。为解决这个问题,可以使用零知识证明(ZKPs)来验证匿名化的医疗记录的真实性。患者可以生成 ZKPs,以证明匿名记录确实是原始记录的副本,即使在删除个人身份信息(PII)后也是如此。这样,患者可以将匿名记录与 ZKPs 一起提供给感兴趣的各方,并甚至获得他们的贡献的奖励,而不会牺牲他们的隐私。
当前 LLM 的一个主要弱点是处理私有数据。例如,当用户与 chatGPT 互动时,OpenAI 会收集用户的私人数据,并将其用于模型的训练,这会导致敏感信息的泄露。这是三星公司的情况。零知识(zk)技术可以帮助解决 ML 模型在私有数据上执行推理时出现的一些问题。在这里,我们考虑两种情况:开源模型和专有模型。
对于开源模型,用户可以在其私有数据上本地下载模型并运行。例如,Worldcoin 计划升级 World ID。在此用例中,Worldcoin 需要处理用户的私人生物识别数据,即用户的虹膜扫描,以创建名为 IrisCode 的每个用户的唯一标识符。在这种情况下,用户可以在其设备上保持其生物识别数据的私密性,下载用于 IrisCode 生成的 ML 模型,本地运行推理,并创建证明表明其 IrisCode 已成功创建。生成的证明保证了推理的真实性,同时保持了数据的隐私。像 Modulus Labs 开发的 ML 模型的高效 zk 证明机制对于这种用例至关重要。
另一种情况是当用于推理的 ML 模型是专有的。这项任务有点困难,因为本地推理不是一种选择。但是,ZKP 有两种可能的方式可以帮助。第一种方法是使用 ZKP 将用户数据进行匿名处理,如前面数据集创建案例中所讨论的,然后将匿名化的数据发送到 ML 模型。另一种方法是在将预处理输出发送到 ML 模型之前,在私人数据上使用本地预处理步骤。在这种情况下,预处理步骤隐藏了用户的私人数据,以便无法重构。用户生成一个 ZKP,表明预处理步骤的正确执行,然后专有模型的其余部分可以在模型所有者的服务器上远程执行。这里的示例用例可能包括可以分析潜在诊断的患者的医疗记录的 AI 医生,以及评估客户私人财务信息的金融风险评估算法。
与专注于生成图片、音频和视频的生成式人工智能模型相比,chatGPT 可能已经抢占了风头。然而,这些模型目前已经能够生成逼真的深度伪造作品。最近由 AI 生成的 Drake 歌曲就是这些模型所能实现的例子。由于人类被编程成相信所见所闻,这些深度伪造作品代表了一个重大威胁。有许多初创公司正在尝试使用 Web 2 技术来解决这个问题。然而,Web 3 技术,如数字签名,更适合解决这个问题。
在 Web 3 中,用户的交互,即交易,由用户的私钥进行签名以证明其有效性。同样,无论是文本、图片、音频还是视频,内容也可以由创建者的私钥进行签名以证明其真实性。任何人都可以根据创建者的公共地址对签名进行验证,该地址在创建者的网站或社交媒体账户上提供。Web 3 网络已经构建了所有需要的基础设施来实现此用例。Fred Wilson 讨论了如何将内容与公共加密密钥关联起来,以有效打击错误信息。许多声誉良好的风险投资公司已经将其现有的社交媒体资料,如 Twitter,或去中心化的社交媒体平台,如 Lens Protocol 和 Mirror,与一个加密的公共地址相链接,这为数字签名作为内容认证方法的可信度提供了支持。
尽管这个概念很简单,但仍然需要大量的工作来改进这个认证过程的用户体验。例如,需要自动化创建内容的数字签名,以提供无缝的流程给创建者使用。另一个挑战是如何生成已签名数据的子集,例如音频或视频片段,而无需重新签名。许多现有的 Web 3 技术独具优势,可以解决这些问题。
另一个 Web 3 可以为人工智能提供帮助的领域是,在专有机器学习模型作为服务提供时,最小化对服务提供者的信任。用户可能需要验证他们所支付的服务是否真正得到了提供,或获得机器学习模型公平执行的保证,即所有用户都使用同一模型。零知识证明可用于提供此类保证。在此架构中,机器学习模型的创建者生成一个表示该模型的零知识电路。需要时,该电路用于为用户推断生成零知识证明。零知识证明可以发送给用户进行验证,也可以发布到处理用户验证任务的公共链上。如果机器学习模型是私有的,则独立的第三方可以验证所使用的 zk 电路是否代表了该模型。机器学习模型的信任最小化方面在模型的执行结果具有高风险时特别有用。例如:
医疗诊断的机器学习模型
在这种用例中,患者提交其医疗数据以供机器学习模型进行潜在的诊断。患者需要确保目标机器学习模型已正确地应用于其数据。推断过程生成证明机器学习模型正确执行的零知识证明。
贷款的信用价值评估
零知识证明可以确保银行和金融机构在评估信用价值时考虑申请人提交的所有财务信息。此外,零知识证明可以证明公平性,即证明所有用户都使用同一模型。
保险索赔处理
目前的保险理赔处理是手动和主观的。机器学习模型可以更公正地评估有关保险单和索赔详细信息的索赔。结合零知识证明,这些索赔处理的机器学习模型可以被证明已考虑所有政策和索赔细节,并且所有同一保险单下的索赔都使用同一模型进行处理。
创建和训练 LLM 是一个耗时且昂贵的过程,需要特定的领域专业知识、专用计算基础设施以及数百万美元的计算成本。这些特征可能会导致强大的中央实体(例如 OpenAI),这些实体可以通过限制对其模型的访问来对其用户行使重大影响力。
考虑到这些集中化风险,人们正在就 Web 3 如何促进 LLM 不同方面的去中心化展开重要的讨论。一些 Web 3 的支持者提出采用去中心化计算作为与中央化玩家竞争的方法。其基本观点是,去中心化计算可以成为一种更便宜的选择。然而,我们认为这可能不是与中央化玩家竞争的最佳角度。去中心化计算的缺点在于,由于不同异构计算设备之间的通信开销,它在 ML 训练中可能会慢 10-100 倍。
作为替代方案,Web 3 项目可以专注于以 PoPW 的方式创建独特且有竞争力的 ML 模型。这些 PoPW 网络还可以收集数据以构建独特的数据集来训练这些模型。一些正在朝这个方向发展的项目包括 Together 和 Bittensor。
过去几周,利用 LLMs 来推理完成某个目标所需任务并执行这些任务以实现目标的 AI 代理正在崛起。AI 代理的浪潮始于 BabyAGI 的想法,并迅速扩散到高级版本,包括 AutoGPT。这里的一个重要预测是,AI 代理将变得更加专业化,以在某些任务上表现出色。如果存在专门的 AI 代理市场,那么 AI 代理可以搜索、雇佣和支付其他 AI 代理来执行特定任务,从而实现主项目的完成。在此过程中,Web 3 网络为 AI 代理提供了理想的环境。对于支付,AI 代理可以配备加密货币钱包,用于接收付款和支付其他 AI 代理。此外,AI 代理可以插入加密网络以无需获得许可地委托资源。例如,如果一个 AI 代理需要存储数据,那么 AI 代理可以创建一个Filecoin钱包,并支付IPFS上的分散式存储费用。AI 代理还可以从分散式计算网络如Akash委托计算资源来执行某些任务,甚至扩展其自身的执行。
鉴于训练性能良好的 ML 模型需要大量数据,可以安全地假定任何公共数据都会被用于 ML 模型,以预测个人行为。此外,银行和金融机构可以建立自己的 ML 模型,这些模型是根据用户的财务信息进行训练的,并能够预测用户的未来财务行为。这可能是对隐私的重大侵犯。这种威胁的唯一缓解是默认的金融交易隐私。这种隐私可以通过使用 zCash 或 Aztec 支付等私人支付区块链和 Penumbra 和 Aleo 等私人DeFi协议来实现。
为非程序员玩家生成机器人
像 Dark Forest 这样的链上游戏创造了一种独特的范例,玩家可以通过开发和部署执行所需游戏任务的机器人来获得优势。这种范式转变可能会排除不能编写代码的玩家。然而,LLM 可以改变这一点。LLM 可以被微调来理解链上游戏逻辑,并允许玩家创建反映玩家策略的机器人,而不需要玩家编写任何代码。像 Primodium 和 AI Arena 这样的项目正在致力于为他们的游戏吸引人工智能和人类玩家。
机器人战斗、赌博和投注
链上游戏的另一个可能性是完全自治的 AI 玩家。在这种情况下,玩家是一个 AI 代理,例如 AutoGPT,它使用 LLM 作为后端,并可以访问外部资源,例如互联网访问和潜在的初始加密货币资金。这些 AI 玩家可以像机器人战争一样进行赌博。这可以开辟一种关于这些赌注结果的投机和赌博市场。
为链上游戏创建逼真的 NPC 环境
目前的游戏很少关注非玩家角色(NPC)。NPC 的行动有限,对游戏进程的影响很小。鉴于人工智能和Web3的协同作用,可以创建更具吸引力的由 AI 控制的 NPC,这些 NPC 可以打破可预测性,使游戏更有趣。这里潜在的挑战是如何在最小化与这些活动相关的吞吐量(TPS)的同时引入有意义的 NPC 动态。过度的 NPC 活动所需的 TPS 要求可能会导致网络拥塞,对实际玩家产生不良用户体验。
目前去中心化社交(DeSo)平台面临的一个挑战是,它们与现有的中心化平台相比并没有提供独特的用户体验。接受与 AI 的无缝集成可以提供缺乏Web2替代品的独特体验。例如,AI 管理的帐户可以通过共享相关内容、在帖子上发表评论和参与讨论来帮助吸引新用户加入网络。AI 帐户还可以用于新闻聚合,总结与用户兴趣相匹配的最新趋势。[ 18 ]
基于 LLM 的 AI 代理可以定义目标、创建代码并执行代码的趋势为测试去中心化网络的安全性和经济健全性创造了机会。在这种情况下,AI 代理被指示利用协议的安全性或经济平衡。AI 代理可以首先审查协议文件和智能合约,识别弱点。然后,AI 代理可以独立竞争执行机制来攻击协议,以最大化自己的收益。这种方法模拟了协议在启动后所经历的实际环境。根据这些测试结果,协议的设计者可以审查协议设计并修补弱点。迄今为止,只有专业公司(例如 Gauntlet)具备为去中心化协议提供此类服务所需的技术技能集。然而,我们预计,经过 Solidity、DeFi 机制和先前的开发机制训练的 LLM 可以提供类似的功能。
尽管区块链数据是公开的,但索引该数据并提取有用的见解一直是一个持续的挑战。该领域的某些参与者(如 CoinMetrics)专门从事索引数据和构建复杂指标以销售,而其他人(如 Dune)专注于索引原始交易的主要组件,并通过社区贡献众包指标提取部分。最近的 LLM 进展表明,数据索引和指标提取可能会受到破坏。Dune 已经认识到了这个威胁,并宣布了一个 LLM 路线图,其中包括 SQL 查询解释和基于 NLP 的查询的潜力。然而,我们预测 LLM 的影响将比这更深入。这里的一种可能性是基于 LLM 的索引,其中 LLM 模型直接与区块链节点交互,为特定的指标索引数据。像 Dune Ninja 这样的初创公司已经在探索创新的 LLM 应用于数据索引。
不同的区块链竞争吸引开发者来建立该生态系统中的应用程序。Web 3 开发者活动是某个生态系统成功的重要指标。开发者面临的主要难点是在开始学习和构建新生态系统时得到支持。生态系统已经投资数百万美元,以专门的开发者关系团队的形式支持探索生态系统的开发者。在这方面,新兴的 LLMs 已经展示出惊人的成果,可以解释复杂的代码、捕获错误,甚至创建文档。经过调整的 LLMs 可以补充人类经验,显著扩大开发人员关系团队的生产力。例如,LLMs 可用于创建文档、教程、回答常见问题,甚至支持 hackathon 的开发人员使用模板代码或创建单元测试。
通过将人工智能集成到 DeFi 协议的逻辑中,许多 DeFi 协议的性能可以显著提高。迄今为止,集成 AI 到 DeFi 的主要瓶颈是实现链上 AI 的成本过高。AI 模型可以在链下实现,但以前没有办法验证模型执行。然而,通过 Modulus 和 ChainML 等项目,链下执行的验证正在变得可能。这些项目允许在链下执行 ML 模型,同时限制链上成本。在 Modulus 的情况下,链上费用被限制为验证模型的 ZKP。在 ChainML 的情况下,链上成本是支付给分散的 AI 执行网络的 Oracle 费用。
一些可以从 AI 集成中受益的 DeFi 用例。
AMM 流动性供应,即更新Uniswap V3流动性的范围。
使用链上和链下数据保护债务头寸的清算保护。
复杂的 DeFi 结构化产品,其中金库机制由财务 AI 模型定义,而不是固定策略。这些策略可以包括由 AI 管理的交易、借贷或期权。
考虑不同链上的不同钱包的高级链上信用评分机制。
我们认为Web3和 AI 在文化和技术上是兼容的。与Web2倾向于排斥机器人不同,Web3由于其无需权限的可编程性而允许 AI 蓬勃发展。更广泛地说,如果您将区块链视为一个网络,那么我们预计 AI 将主导网络的边缘。这适用于各种消费者应用,从社交媒体到游戏。到目前为止,Web 3 网络的边缘在很大程度上是人类。人类启动和签署交易或实施具有固定策略的机器人。随着时间的推移,我们将看到越来越多的 AI 代理在网络边缘处。AI 代理将通过智能合约与人类和彼此进行交互。这些交互将使新颖的消费者体验成为可能。