2023年海内大模型领域可谓是风波不断,频繁涌现套壳事宜。首先科大讯飞大模型被曝出"我是由OpenAI开拓的"等令人惊异的回答,其产品还因学习机内容问题而下架,从而引发了外界对其是否套壳的质疑。
百度文心一言在处理中文指令时也涌现了一些让人迷惑的结果,被疑惑是套壳国外开源AI模型。零一万物发布的开源大模型Yi-34B更是被指完备照搬LLaMA模型架构,仅对两个张量名称做了修正。
然而随着海内大模型备案制度的推出,通过备案的大模型险些不再有套壳质疑。这紧张是由于大模型套壳很随意马虎被创造,通过比较输出、性能、词表特色等就能看出来。而且llama等头部开源大模型虽然开源了框架,但演习代码并没供应,演习数据也没有曝光,核心机制外界无法知晓。
再者,海内上线的大模型有备案制度,且受到意识形态的限定,利用国外数据演习的大模型无法知足哀求,也无法在中国商用。并且由于开源特性,大模型套壳存在可能性,但备案制度等方法有效地减少了这类事宜的发生。