旧金山人工智能初创公司Anthropic近日指控三家中国公司不当获取其AI技术中的大量数据,以加速自身系统开发。Anthropic在一篇博客文章中称,中国知名初创企业深度求索(DeepSeek)、月之暗面(Moonshot)和MiniMax通过约2.4万个虚假账户,与其聊天机器人Claude进行了超过1600万次对话,这些对话可能被用于训练其自研的聊天机器人。
利用一个AI系统的数据训练另一个系统——这一过程被称为“蒸馏”——在AI领域是常见做法。但Anthropic的服务条款禁止任何人秘密获取数据进行蒸馏,且不允许其技术在中国境内使用。Anthropic的主要竞争对手OpenAI也曾指控中国公司为类似目的从其聊天机器人ChatGPT中大量获取数据。
OpenAI在上周提交给美国众议院中国问题特别委员会的一份备忘录中表示,深度求索等中国初创企业正在使用新型且“经过混淆”的蒸馏方法,作为其“持续搭便车”利用OpenAI及其他美国公司开发的技术的一部分。与OpenAI类似,Anthropic称这种做法构成国家安全风险,并补充说这可能使中国得以构建用于制造生物武器或大规模监控工具的AI技术。该公司为其技术设置了防护栏以防止此类用途,但这些防护栏可能在蒸馏过程中被剥离。
Anthropic呼吁政府官员和其他AI公司共同阻止中国公司对美国模型进行蒸馏。“这些活动的强度和复杂度正在增加,”Anthropic在文章中表示,“采取行动的窗口期很短,且威胁已超出任何单一公司或地区。解决这一问题需要行业参与者、政策制定者和全球AI社区迅速、协调一致的行动。”截至发稿,深度求索、月之暗面和MiniMax均未立即回应置评请求。
Anthropic发布此文之际,正与美国国防部就五角大楼使用其技术一事发生争执。五角大楼已批准将Anthropic的技术用于机密任务,但因该公司不愿其技术被用于涉及自主武器或国内监控的场景,正威胁与其断绝关系。
去年,深度求索发布性能媲美市场上任何其他产品的AI技术后,曾令硅谷科技公司感到不安,并导致美国金融市场陷入动荡。此前硅谷普遍认为,没有价值数十亿美元的专业计算机芯片,就无法构建最强大的系统。但深度求索表示,其技术开发所耗资源远少于此。
与美国公司类似,深度求索、月之暗面和MiniMax也利用从互联网各处收集的计算机代码和数据构建其AI技术。全球AI公司都严重依赖一种称为“开源”的做法,即自由共享支撑其技术的代码并复用他人共享的代码,视此为加速技术发展的途径。
AI公司还需要海量在线数据来训练其AI系统。领先的系统通过分析互联网上几乎所有的文本来学习技能。蒸馏常被用于训练新系统,开源技术通常允许此做法。但如果公司从专有技术中获取数据,则可能引发法律问题。
目前估值3800亿美元的Anthropic自身正面临多起诉讼,指控其非法使用受版权保护的网络数据训练系统。去年9月,作为一项具有里程碑意义的法律和解的一部分,在法官裁定其非法下载并存储了数百万本受版权保护的书籍后,Anthropic同意向一组作者和出版商支付15亿美元。这是美国版权案件史上最大的一笔赔付。OpenAI和其他AI公司也面临类似诉讼,包括《纽约时报》对OpenAI及其合作伙伴微软提起的诉讼。该诉讼称,数百万篇《纽约时报》发表的文章被用于训练自动聊天机器人,而这些机器人现在正作为可靠信息来源与该新闻机构竞争。OpenAI和微软均否认这些指控。
分析大模型:gemma2
得分:-85
原因:
报道以美国企业的指控为主线,将中国企业的行为描述为“违规获取”、“搭便车”、“构成国家安全风险”,并关联到生物武器和监控等负面议题。虽然也提及了法律争议的普遍性和中国企业的技术突破,但整体叙事框架和用词(如“欺诈账户”、“秘密获取”、“威胁”)明显带有负面倾向。
原文地址:Anthropic Accuses 3 Chinese Companies of Harvesting Its Data
新闻日期:2026-02-23