早泄皮肤补水白癜风雀斑癫痫高血压肝硬化青光眼尿毒症腹泻腰肌劳损预防肝癌牙龈肿痛改善哮喘痛经前列腺炎广告

华为盘古否认抄袭阿里后，其大模型员工自曝存在套壳、续训、洗水印

举报/反馈

2025-07-07 14:08 投稿：adminzmy

中医专业治疗鼻炎妇科炎症苦不堪言？肛周湿疣中医治疗配方 30岁后该怎么有效减肥和抗衰老吃什么食物丰胸的效果好管不住嘴如何控制食欲减肥

核心提示：华为高调宣布开源其盘古大模型核心组件(PanguProMoE)，包括70亿参数稠密模型和720亿参数的混合专家模型，宣称这是构建昇腾生态的关键举措。

华为高调宣布开源其盘古大模型核心组件(PanguProMoE)，包括70亿参数稠密模型和720亿参数的混合专家模型，宣称这是构建昇腾生态的关键举措。

然而仅隔四天，一项发布于GitHub的研究引发业界关注：用户@HonestAGI通过“LLM指纹”技术分析指出，盘古ProMoE与阿里通义千问Qwen-2.514B模型的注意力参数分布相似性高达0.927(1.0为完全一致)，远超业内0.7以下的正常差异范围。

华为诺亚方舟实验室7月5日发布最新声明，表示盘古ProMoE开源模型是基于昇腾硬件平台开发、训练的基础大模型，并非基于其他厂商模型增量训练而来。

然而，就在7月6日凌晨，一位自称是盘古大模型团队的员工自爆，确实存在套壳、续训、洗水印的现象。

该员工表示，由于团队初期算力非常有限，虽做出了很多努力和挣扎，但没有预期效果，内部的质疑声和领导的压力也越来越大。后来小模型实验室多次套壳竞品，领导层被指默许造假行为换取短期成果。

自爆文中称：“经过内部的分析，他们实际上是使用Qwen1.5110B续训而来，通过加层，扩增ffn维度，添加盘古pi论文的一些机制得来，凑够了大概135B的参数。”并表示，“听同事说他们为了洗掉千问的水印，采取了不少办法，甚至包括故意训了脏数据。”“他们选择了套壳Deepseekv3续训。他们通过冻住Deepseek加载的参数，进行训练。”

最后他表示出于对技术伦理的坚持，决定离职并曝光内幕。

截至目前，华为并未对此自爆内容发表声明。

版权及免责声明：用户应基于自己的独立判断，自行决策投资行为并承担全部风险。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件(lufang0898@126.com)举报，一经查实，本站将立刻删除。

延伸阅读

股票知识 基金知识理财贷款信用卡

最新热点一周热点

热门问答更多

健康导购更多