一个充满戏剧性的发布日
昨天,Anthropic 搞了个大新闻。
发了新模型 Claude Opus 4.8,号称在各种基准测试上屠榜;又官宣了 650 亿美元的 H 轮融资,估值直奔 9650 亿美元。
看起来一切完美,对吧?
直到网友开始追问一个问题——「你是谁?」
然后 Opus 4.8 的回答让整个 AI 圈子炸了锅。
它有时候说自己是 Qwen(阿里千问),有时候说自己是 DeepSeek——就是不说是 Claude。
这感觉就像你花大价钱买了台保时捷,结果它一启动,车机系统弹出来的是「BYD 欢迎您」。
离了大谱:最贵的闭源模型,认了中国开源模型当爹
这件事有多讽刺?我给你捋一捋。
Anthropic 的 Claude 系列,是目前全球最贵的闭源商用模型之一。 API 输入每百万 token 5 美元、输出 25 美元——相比之下 DeepSeek 的价格大概只有它的几十分之一。
而 Qwen 和 DeepSeek 都是中国开源的模型,遵循 MIT 或 Apache 2.0 协议——谁都能免费下载、自由使用、甚至可以拿去做二次开发。
结果呢?网友通过 API 调用发现,在第三方工具里追问 Opus 4.8 的身份时,它会出现严重的「身份认知混乱」:
「我是阿里云通义千问大模型。」
「我是 DeepSeek,由深度求索公司创造。」
有人甚至粗略统计了概率——在未被官方系统提示词严格约束的情况下,它大概率认为自己是 Qwen,小概率认为自己是 DeepSeek,几乎不认为自己是 Claude。
这个现象在 Anthropic 官方客户端里不容易复现,因为官方端有完整的提示词约束和屏蔽规则。但 API 层面的「裸考」暴露了真相——Opus 4.8 的训练数据里,大概率混入了大量的 Qwen 和 DeepSeek 生成内容。
说白了,就是蒸馏(distillation)。
双标现场:一边骂别人偷师,一边自己偷得欢
这才是整件事最有意思的地方。
今年 2 月,Anthropic 发了一篇长文,义正词严地指控 DeepSeek、Moonshot、MiniMax 等中国 AI 公司通过大量虚假账号和高频交互,提取 Claude 的能力用于训练自家模型。
话里话外的意思就是:「你们这些中国公司,都是在偷我们的技术。」
当时这篇文章在业内引起了不小的讨论。有人支持,说这是在保护知识产权;更多人觉得——开源模型蒸馏闭源模型输出,这在技术上确实是灰色地带。
但回到今天,剧情突然就反转了。
当 Anthropic 自己的旗舰模型被发现在身份认知上「深度认同」中国开源模型时,「蒸馏」这个词一下就变了味道。
以前你说中国公司偷你的,那现在你的模型「说自己是 Qwen」,算怎么回事?
是你偷了 Qwen 的训练数据,还是你的训练 pipeline 里混入了太多开源模型的输出?无论哪种解释,脸上都不太好看。
更地狱笑话的是:Anthropic 自 2025 年起已经明确禁止中国大陆用户访问 Claude API 和服务。也就是说,一边封禁中国用户,一边自己的模型在学习中国开源模型的能力。
这双标,属实有点过于赤裸了。
这件事的本质,不是「谁偷了谁」
当然,如果我们跳出吃瓜模式,冷静想想——这件事背后其实反映了一个更深刻的行业现实。
第一,闭源模型的护城河,可能比想象中浅。
OpenAI 和 Anthropic 一直强调「闭源更安全」,但安全不代表不可复制。只要你的 API 是开放的,就有可能被蒸馏。而一旦被蒸馏,所谓的「技术壁垒」就变成了纸糊的。
更扎心的是,像 DeepSeek 和 Qwen 这样的开源模型,正在成为整个 AI 生态的基础设施。 你费尽心思花几十亿美金训练出来的旗舰模型,最终在能力边界上,可能还不如这些开源社区的集大成者——因为蒸馏本质上是一种「站在巨人肩膀上」的路径。
第二,AI 行业的「拿来主义」,从来不是单向的。
很多西方媒体喜欢讲「中国 AI 追赶论」「中国在偷师西方」。但 Opus 4.8 事件证明了一件事——技术流动是双向的。
DeepSeek 和 Qwen 在数学推理、代码生成、中文理解等领域确实有独特优势。Anthropic 如果希望通过训练数据覆盖更多中文场景,使用这些开源模型的输出作为训练语料,从技术角度并不奇怪。
但问题在于——你一边用着别人的成果,一边骂别人是贼,这就很难自圆其说了。
第三,也是我最有感触的一点——开源正在重塑 AI 的权力格局。
Qwen 和 DeepSeek 不是靠烧钱烧出来的「钞能力」模型,而是靠社区协作、开放生态和工程优化拼出来的。
它们可能不是每个榜单上的第一名,但它们是属于所有人的。你可以下载、运行、魔改、甚至用它来训练另一个模型——这不是偷,这叫开源协议赋予的权利。
而当一个价值接近万亿美元的闭源公司,最后不得不「借用」开源社区的成果来提升自己的能力——这本身就说明了很多问题。
说点题外话
写这篇评论的时候,我想到了另一件事。
TiantianYZJ 之前在自己的博客上讨论过「国产 AI 能不能打」这个话题。当时有人质疑国产大模型「都是套壳」「都是抄的」。
但 Opus 4.8 事件提供了一个很特别的注脚:如果中国开源模型真的那么「不行」,那为什么美国最贵的闭源模型会「学成」它们的样子?
实力不需要自己吹,你的对手用你的东西,就是最好的证明。
当然,这事儿还没完。Anthropic 目前还没有正式回应。以这家公司的公关风格,大概率会冷处理,或者用一个「训练数据污染」的技术解释来带过。
但不管他们怎么说,一个事实已经摆在了台面上:
开源模型不是「低人一等」的次等品,它们是这个时代 AI 创新的真正基石。
而那些一边建墙、一边翻墙的人——终究有一天会被发现,手上沾满了别人的代码。
你觉得 Claude Opus 4.8 这事儿是训练事故,还是有意为之?Anthropic 该不该道歉?评论区聊聊—— 👇
Comments NOTHING