披露:此处表达的观点和意见仅属于作者,不代表 crypto.news 编辑的观点和意见。
人工智能风靡一时。然而,在去中心化人工智能(DeAI)的炒作背后隐藏着一个关键缺陷:缺乏多样化、安全、可验证的数据。链上数据集太有限,无法训练真正强大的模型。这有可能将人工智能的未来拱手让给中心化的巨头,这些巨头可以不受限制地访问网络上的海量数据。
DeAI 的承诺——民主化、透明且强大的人工智能——取决于弥合这一数据鸿沟。巧妙的加密技术提供了一条途径。
传统人工智能的魅力在于它的贪婪。它吞噬的数据越多,它就越聪明。但这一优势也是它的致命弱点。集中式人工智能模型的训练数据往往是在未经明确同意的情况下收集的,这引发了隐私和控制方面的棘手问题。
DeAI 建立在区块链的去中心化和透明原则之上,提供了一种有吸引力的替代方案。然而,大多数链上数据来自金融交易或 DeFi。小型语言模型尤其需要更精确的数据进行微调。这使得 DeAI 模型缺乏丰富多样的数据集,无法将其细化到最新模型所期望的竞争水平。
此类数据集在 web3 之外也可用,The Pile 和 Common Crawl 均包含来自数十亿个独特来源的数据。现有经过验证的 web2 数据源的深度与数据量一样多,这使得中心化 AI 提供商能够尽可能快速地完善其 GPT。
在竞争激烈的时间范围内,在链上重新创建相同级别的数据是不可行的。虽然一些人工智能公司与数据创建者发生冲突,后者指责他们窃取了本文讨论的这类细微数据,但还有另一种方法可以在链上获取更多数据——使其更安全。
这正是加密技术的用武之地。零知识证明已经在区块链可扩展性和隐私方面掀起了波澜,它提供了一个有效的解决方案。特别是两种技术——零知识全同态加密 (zkFHE) 和零知识 TLS (zkTLS)——是解锁 Web2 数据以用于 DeAI 的关键。
zkFHE 允许对加密数据进行计算而无需解密。想象一下,在敏感的医疗记录上训练 AI 模型,而无需暴露原始患者数据。这就是 zkFHE 的强大之处。它允许 DeAI 模型从庞大的、受隐私保护的数据集中学习,从而大大扩展了它们的训练可能性。
zkTLS 将这一原则扩展到互联网通信。它允许用户证明拥有来自网站的某些数据(例如信用评分或社交媒体活动),而无需透露底层信息。这对于将驻留在 web2 孤岛中的大量数据集成到 DeAI 系统中至关重要。例如,去中心化信用评分模型可以利用 zkTLS 访问来自传统机构的经过身份验证的财务数据,而不会损害其机密性。
其影响是深远的。通过结合 zkFHE 和 zkTLS,DeAI 可以利用 web2 的海量数据,同时保留隐私和去中心化的核心原则。这可以创造公平的竞争环境,让 DeAI 能够与中心化 AI 竞争,甚至超越它。