Disclosure: The views and opinions expressed here belong solely to the author and do not represent the views and opinions of crypto.newsâ editorial.
当 OpenAI 的图像生成器首次展现出模仿吉卜力工作室标志性动画风格的能力时,粉丝们都惊呆了。但真正令人震惊的不仅仅是其惊人的精准度——而是吉卜力的作品很可能像无数其他作品一样,在未经许可或任何报酬的情况下被抄袭用于训练模型。这家备受喜爱的工作室数十年来积累的宝贵遗产,被机器吞噬,然后又被吐出来,以取乐。
您可能还喜欢:人工智能扼杀创造力。区块链拯救创造力 | 观点
这并非个例。从 ChatGPT 到 Midjourney,全球最强大的人工智能模型都基于数十亿未经授权的数据进行训练。尽管人工智能带来了巨大的好处,从医学突破到自动化生产力,但它也悄无声息地在剥削的基础上建立了一个帝国。这些系统并非中立。它们反映了其所消费数据中蕴含的文化、假设和偏见。
是时候认清我们所有人的身份了:无偿数据创造者。无论你是发布照片、撰写说明,还是为机器学习任务标记数据集,你都在为人工智能的未来贡献力量。到了2025年,我们该问:谁受益?谁又被抛在后面?
Big Techâs dirty data secret
From the start, AIâs most powerful models were fed by scraping massive swaths of the internet. Be it books, forums, code, images, all were ingested without credit or consent. Your tweets, Reddit posts, YouTube videos, blog comments, and even creative work became training fodder for multi-billion-dollar platforms.
法律诉讼开始层出不穷。《纽约时报》起诉OpenAI侵犯版权。Getty Images已将Stability AI告上法庭。艺术家和程序员们变得更加紧张,并联合起来要求公平对待。但多年来,这些公司却肆无忌惮地运营——将互联网的集体智慧转化为牟利的产品。
这种榨取经济对大多数人来说并不明显,但其影响却深远。人工智能公司出售订阅服务,筹集数十亿美元资金,并主导市场——而公众——他们为这些系统提供的知识却没有得到任何回报。
文化是克隆的,不是创造的
一个值得铭记的深刻事实是,人工智能并非创造。它只是模仿——而且通常模仿得很糟糕。当一个模型生成一幅画、一首诗或一个标题时,它并非在创造新的东西。它只是将人类现有作品的片段重新混合——剥离了背景、细微差别和意义。
更糟糕的是,它习惯于复制我们最糟糕的特质。人工智能系统从其训练数据中继承了偏见、文化假设和语言模式。结果呢?刻板印象被放大到极致。边缘群体的声音瞬间被抹去。机器只会鹦鹉学舌地重复那些强势或最坚定的观点。
Without intentional diversity in AI training, we risk a future where intelligence is defined by the few. Thatâs why the makeup of who trains AI matters more than ever.
The rise of the data creator
在这个全新的数字经济时代,数据创造者不再仅仅是消费者或用户,他们更是建设者。从标记图像、注释文本,到审核数据集或生成结构化洞察,日常生活中的人们正逐渐成为机器学习基础设施不可或缺的一部分。
这不仅仅是技术上的转变,更需要经济上的转变。想象一下,一个去中心化的数据平台,贡献者可以根据他们的时间、技能和知识获得报酬。无论是通过稳定币、代币还是法币,人们都可以通过帮助训练人工智能直接获得报酬。这将创造一种新型的劳动力市场,一个更加灵活、全球化、对任何拥有智能手机和空闲时间的人开放的市场。
对于历史上被剥夺了机会的群体——农村工人、难民和没有银行账户的人——数据工作可以成为他们的生命线。只需极少的设备和基本的数字接入,他们就可以参与到地球上发展最快的行业之一,并提升技能。
去中心化智能是全球当务之急
为了实现这一目标,我们需要重新思考人工智能的训练方式。最好的解决方案是什么?建立一个去中心化的网络,让社区掌控智能的未来。
Hereâs how it can work: enterprises submit data needs to a distributed platform. A global network of annotatorsâindividuals working for their own benefitâcomplete tasks like labelling, tagging, creating, or refining datasets. These datasets could cover lip syncing, audio datasets, creating road sign datasets, or simple annotations. Gamified systems boost engagement and quality, turning data work into competitive challenges. The community governs itself, maintaining standards and voting on major decisions, while contributors build up reputations and earn rewards.
该模式高效、透明,最重要的是包容性强。借助区块链支持的可追溯性,企业可以验证其付费数据的质量和来源。这形成了一个闭合的价值循环:企业获得所需的训练数据,而人们则因其提供的情报而获得报酬。
这不仅仅是为了颠覆大型科技公司,更是要创造一种全新的智能:去中心化、民主化、多元化。至关重要的是,我们还要让人类参与其中。
打破垄断意味着重建体系
大型科技公司对人工智能的垄断不仅仅是经济层面的,更是意识形态层面的。这些公司决定着哪些数据重要,谁来训练模型,以及谁的声音在机器智能的未来中举足轻重。
但去中心化的替代方案改变了游戏规则。它们分配权力,鼓励参与,并将价值回馈给创造价值的人。它们挑战了过去十年数字增长中定义的榨取式规范。
最优秀的人工智能并非源自最庞大的数据集,而是源自最多样化、最符合伦理道德、最有意图的数据集。这样的未来不仅仅是可能,它已在构建中。
我们选择训练的未来
想象一下:一个偏远村庄里的年轻人,除了一部二手智能手机和免费Wi-Fi外一无所有。他加入了一个全球网络,并付费让他参与训练人工智能。他免费开设了一个数字钱包——他的第一个银行账户。他完成的每一项任务——标记图像、验证数据集——都会给他的钱包带来收入。他买食物,为妹妹支付学费。他第一次在全球经济中拥有了自主权。
这不是科幻小说。这是我们可以选择的未来。
So hereâs the call: if youâre building, design with people at the center. If youâre investing, back decentralized intelligence. If youâre using AI, ask: Who trained this modelâand were they paid?
We are no longer just users of technology. We are the trainers of tomorrowâs intelligence. If we want AI to reflect us, then we must take back the mirror.
阅读更多:DeepSeek、中国和俄罗斯的人工智能合作:西方世界已注意到 | 观点
约翰娜·卡比尔多
乔安娜·罗斯·卡比尔多是 Data Guardians Network (D-GN) 的创始人兼首席执行官,这是一个去中心化的平台,通过社区驱动的数据训练,让人工智能触手可及。此前,她曾在 droppGroup 领导沙特政府、沙特阿美和思科的企业人工智能项目,带来前沿创新。Johanna 拥有技术、设计和加密货币交易方面的背景,是一位持续自学的建设者,致力于将好奇心转化为影响力。她的使命是打造真正的科技入口,让任何人,无论身在何处,都能贡献力量,并拥有属于自己的未来。