科工力量斯坦福AI团队抄袭中国大年夜模型背后还有更值得关注的信息

斯坦福团队抄袭中国开源大模型，事宜曝光后连夜删库跑路。

对这条新闻，恐怕不少人第一反应和科工力量一样，有种一吐胸中忧郁的感想熏染。
此前很长一段韶光，从美国朝野锁去世中国AI研究能力的叫嚣，到中文网络上对国产大模型怪话连篇的调侃，让很多人对中国AI家当的发展倍感焦虑，而通过这次事宜，这样的焦虑恐怕可以得到相称程度的纾解。

经由近两天的发酵，这发难宜本身毫无疑问已经“实锤”，不仅Llama3-V团队发布道歉声明，作为被抄袭方的面壁智能，也由CEO李大海透露了核查结果，Llama3-V和MiniCPM-Llama3-V-2.5这两个模型即便在高斯扰动验证后，在精确和缺点表现方面都高度相似。

两个模型的代码比拟

科工力量斯坦福AI团队抄袭中国大年夜模型背后还有更值得关注的信息

不过连续挖掘信息的话可以创造，实在所谓的斯坦福团队只是两个印度裔本科生自己攒的局，闯祸后，他们还第一韶光把锅甩给了实际干活的枪手，声称自己是被阿拉伯裔码农描述的多模态架构忽悠了，他们实际只是在社交媒体平台帮着后者宣扬推广。

而扛下了所有的码农“枪手”Mustafa Aljadery，也是个妙人，根据其网上简历，目前同时写了三份全职事情，除了两个自己注册的小微企业，还包括量化投资大厂Citadel“即将入职的暑期演习生”。

总之，这个“斯坦福团队”里的卧龙凤雏，倒是让人见识到了美国科技家当最底层的一个微不雅观切片，相互忽悠攒项目、海投注水论文“抽奖”、绞劲脑汁包装履历，湾区大学生的求职“内卷”也其实不随意马虎。

斯坦福的作者在中午做出了最新回应，但现在这条回应已删除图源：网友截图

Aljadery之以是抄上MiniCPM-Llama3-V-2.5，很可能是由于这个模型前一段韶光在HuggingFace趋势榜上连续霸榜，性能表现非常亮眼，OpenCompass性能基准榜单上均匀得分65.1，乃至超过了GPT-4V、Gemini Pro 这些主流商用模型，而开拓者在美国彷佛又没有什么关注度，以是他们认为抄过来交差该当没什么风险。
但这次东窗事发之后，几个年轻人恐怕都会面临“偷鸡不成蚀把米”的后果。

斯坦福人工智能实验室主任Christopher Manning发文训斥抄袭行为，他认为团队在事发后避重就轻，并对MiniCPM 这一中国开源模型表示赞赏。

在科工力量看来，这次事宜背后，还有着更值得关注和磋商的信息。

自从ChatGPT亮相以来，有关海内AI家当发展的谈论中，已逐渐形成了所谓的技能派和市场派分野，前者以入局企业为代表，每每用“相称于GPT-x.x”来衡量技能能力，力求追上乃至反超美国巨子，而后一派则以PE/VC投资人为代表，认为OpenAI等企业连续不断的打破已经解释，海内没有可能也没有必要连续在根本大模型上苦苦追赶，该当利用开源大模型成果，聚焦于挖掘场景运用代价。
基于这样的认识，乃至有人喊出了“不会投场上任何一家中国大模型公司”。

在过去一两年内，这样的辩论或许是各有理据的，不过本日的中国毕竟不同于技工贸和贸工技只能二选一的年代了，我们所拥有的根本和资源，已经足以支撑“成年人不做选择”。

以是我们会看到，一方面，技能派的打破在2024年已经有加速态势，像月之暗面Kimi、幻方DeepSeek这些产品，近期在美国业界引发广泛关注；而另一方面，就像这次事宜所展现的，海内基于开源大模型的派生模型开拓水平也越来越高，像MiniCPM-Llama3-V 2.5是基于SigLip-400M和Llama3–8B-Instruct构建，而开拓者面壁智能最新发布的开源大模型Eurux-8x22B，则是基于Mixtral-8x22B，号称早于Llama3、比肩Llama3、推理超越Llama3，刷新开源大模型推理性能SOTA。

月之暗面Kimi与幻方DeepSeek的平台界面

这些进展当然令人欣喜，不过无论技能派还是市场派，未来要走的路还很长。
比如，海内根本大模型开拓者在实现GPT-4o乃至未来GPT-5的技能能力后，如何造就开拓工具链和运用生态，仍将是一大寻衅；而对付聚焦场景与领域运用落地的企业，则有必要回答这样一个追问：开源大模型是否永久是免费的午餐？

诚然，目前开源大模型社区，尚未受到地缘成分的明显滋扰，但即便没有人兴风作浪“拖后腿”，长期安于利用别人的根本模型成果，也意味着将制高点拱手让给他人。

更值得把稳的是，在开源大模型原始创新上，欧洲、特殊是法国正霸占不容忽略的地位，AI大模型的美中法“三国杀”格局已隐约可见。

详细来看，上文提到的Mixtral-8x22B，就来自于法国初创企业Mistral AI；至于Llama系列，只管名义上是美国巨子Meta的产品，但其开拓团队则紧张位于法国，干系人才和知识自然也紧张在法国流动。

在斯坦福大学体例的《AI指数报告2024》中，紧张机器学习模型的“原产地”排名上，美、中、欧盟已分别霸占前三排名

可资参照的是，在斯坦福大学体例的《AI指数报告2024》中，紧张机器学习模型的“原产地”排名上，美、中、法已分别霸占前三排名；欧盟加英国合计，更是已超越中国。

这样的格局中，蕴含着不言自明的威胁性，如果海内AI家当界连续对开源根本模型秉持“拿来主义”，长此以往则可能进一步增强欧洲在家当竞争中的主动性，毕竟在根本模型之外，欧洲得到高端算力的便利性也远强于海内。

总体而言，以这一事宜为标志，随着中国AI大模型家当的迅速发展，其对美国度当生态的“反浸染力”也会越来越频繁而显著，能否在多边博弈中稳中求进，离不开每一个家当人的共同努力。

本文系不雅观察者网独家稿件，文章内容纯属作者个人不雅观点，不代表平台不雅观点，未经授权，不得转载，否则将深究法律任务。
关注不雅观察者网微信guanchacn，逐日阅读意见意义文章。

科工力量斯坦福AI团队抄袭中国大年夜模型背后还有更值得关注的信息

duote123管理员

2024FIRST惊喜片子展绽放檀谷韩庚佟丽娅张若昀出任主办人

徐房工匠学院揭牌成立维急修白蚁防治样样行

科工力量斯坦福AI团队抄袭中国大年夜模型背后还有更值得关注的信息

duote123管理员

2024FIRST惊喜片子展绽放檀谷 韩庚佟丽娅张若昀出任主办人

徐房工匠学院揭牌成立维急修白蚁防治样样行

2024FIRST惊喜片子展绽放檀谷韩庚佟丽娅张若昀出任主办人