趋势一:人机交互越自然,利用人数越海量

基于大措辞模型的对话式交互,降落全民对AI工具的开拓与利用门槛,将极大刺激AI市场需求的爆发。
人机交互界面意味着人类指挥终真个效率和体验,早期专业技能职员利用的命令行界面(CLI),是让人说“机器的措辞”,之后Windows和iPhone上受教诲大众利用的图形界面(GUI),以人类操作图形来掌握机器,再到如今浩瀚模型、软件采取对话式交互界面(CUI),让机器、程序利用“人类的母语”(自然措辞、方言)互换,包括多模态交互办法,让冷冰冰的机器“拟人化”,变身数字人伴侣、生产力助手,走入做事行业,智商与情绪的双轨进步,让AI打破“图灵测试”,成为人类社会的“新成员”。

趋势二:智能云+智能端协同打算,AI设备嵌入“小模型”

AI云卖力演习,AI终端卖力推理,算力格局初显。
目前AI写作、AI绘画、AI编程、AI天生视频、AI数字人、AI办公助手、AI营销助手、AI虚拟角色、智能驾驶等层出不穷的AIGC运用,估量将成为未来5年数字经济的新动能。
每一次模型运用都是一次推理打算,虽然单次推理算力本钱很低,但数亿用户进行数亿次推理时,推理算力的总本钱,将超过演习算力总本钱。
伴随爆款AIGC运用的涌现,弘大的用户访问量持续推高推理打算本钱,将带来“AI云-AI端”的算力分工与转移。

田丰2024大年夜模型家当十大年夜趋势

同时,小模型正在拥有大模型的效果,以及硬件终端算力的良好适配性与功耗。
法国创业公司研发的Mixtral 8x7B模型凭借70亿参数量,在大多数国际标准基准测试中与 GPT3.5 相匹配乃至更优(1750亿参数量)。
而另一方面,微软凭借27亿参数量的Phi-2,在各种综合基准测试中,其性能超过了 Mistral (70 亿参数)和 Llama-2 模型(130 亿参数)。
在多步推理任务(即编码和数学)上,它比 25 倍大的 Llama-2-70B 模型具有更好的性能。

趋势三:多模态大模型,成为“生产力遥控器”

多模态大模型降落生产本钱,激活指数级市场需求,通信革命将开启新一轮工业革命。
大措辞模型被视为新一代人机通信革命,当新一代“运用软件”(AI模型)与新一代“硬件终端”(机器人、AR眼镜等)加速领悟后,下一轮工业革命大幕拉开。
在供给侧,基于大模型的智能体变成人类的“生产力遥控器”。
伴随AI芯片嵌入智能车、智能机器人、智能AR眼镜、智能家电等所有终端,人类个体在“人机协同”模式下能够同时指挥的生产资料规模大幅上升。

趋势四:智能基建重资产投入,发展空间巨大

大模型、大打算、大数据都具有重资产投入的发展特色。
智能打算根本举动步伐在长周期培植过程中,具有“成本密度”、“算力密度”、“数据密度”持续增加的特色,目前投资总额尚具有极大提升空间,将不断增强我国经济的比较上风。

传统经济学理论中,新型社会根本举动步伐的重大意义在于促进技能进步、提高生产率、加速内生经济增长,具有良好的“正外部性”与“网络效应”。
数字中国培植,与“数字根本举动步伐互联互通”、“数据资源规模和质量”紧密干系。
在中国“智能打算基建化,传统基建智能化”的过程中,科技创新是推动经济增长、社会根本举动步伐高质量发展的源动力,而智能打算根本举动步伐具有边际本钱持续低落、边际效益持续增长的特色。

趋势五:更便宜的AI芯片价格,将加速AIGC运用创新规模化扩展

AI芯片已成为AI从业者的沉重“税负”,让AI算力本钱回归社会公共做事的平民价格,是数字经济3.0可持续发展的关键。
市场上AI算力的稀缺为少数芯片制造商带来巨大的市场掌握权,并享受涨价带来的高额利润。
据美国金融机构Raymond James透露,头部AI芯片公司的利润率可能高达1000%。
在《埃隆·马斯克传》中,马斯克提出“白痴指数”,从第一性事理(物理学)出发,打算成品总本钱与基本原材料本钱的比值,如果一个产品的白痴指数非常高,则可通过设计更高效的制造技能来大幅降落本钱,例如传统火箭上一个组件的本钱是1000美元,而其铝材料本钱只有100美元,那么可能由于设计过于繁芜或制造工艺过于低效。
虽然我们不知道GPU的生产本钱,但经济学事理来看,在如此高额利润的刺激下,更多低价格的竞争对手(含国产AI芯片)将会呈现,让AI芯片回归公共根本举动步伐的实质,由于水电根本做事不会比金子更贵,在AI芯片架构研发与生产工艺创新中,更多代价将逐步从芯片开释出来,向算力做事、模型做事、AI2.0运用转移。
反之,长期过于昂贵的AI芯片价格,会让面向大众市场(to Consumer)的所有AIGC创新运用,因昂贵的“芯片税”而衰败,无法形成“数字经济3.0”的创新浪潮。

趋势六:更便宜的能源,更大的模型产能

算力花费的能源是另一半AIGC创新运用必须分摊的本钱,持续降落的能源本钱,对AI2.0运用生态康健良性发展至关主要。

以Meta研发的措辞大模型LLaMA为例,演习LLaMA-65B (650亿参数量,属于中等规模)的耗电,以美国电价0.87元/度估算,须要449W1022362h0.87=408944800元,约40万元公民币。
而OpenAI的GPT-3耗电量高达1287兆瓦时,伴随大模型参数量、数据量的上涨,能源支出本钱将会急剧上升,家当链终极将整天职摊到每一个AIGC运用、AI for Science科研项目、智能制造系统上,引发AI2.0运用的“本钱门槛”压抑大众创新需求。
大模型家当数据剖析显示,大措辞模型的演习本钱中,电力用度占比高达65%。
当“万亿参数量”的GPT-4,以及更大规模参数量的GPT-5到来时,能源与算力本钱将会扭曲商业逻辑,或让很多运用创业者望而生畏。

趋势七:跨措辞、跨时空的环球知识传播速率,亘古未有提高

博古通今的大模型,引发“知识生产力变革”,大模型是知识工程的生产力变革,天然具有跨领域知识的连接性。
据多方研究数据表明,大型措辞模型显著提高知识学习速率、知识检索速率、知识传播速率、知识推举准确性,具有跨措辞、跨学科领域、跨信源的独特上风。
在人机协同模式下,大型措辞模型将人类科学论文的阅读韶光缩短40%,知识搜索韶光缩短20%,而这仅仅是ChatGPT涌现一周年的“出发点”,鉴于大型措辞模型远超人类的超高速学习能力,估量将在2026年学习完所有人类历史上的高质量文本数据。
人类的知识革命大幕刚刚开启,高新科研、三大类家当、公共做事的知识型事情范式正在遵照“打算->数据->模型->做事”链条重构。

趋势八:每一次软件改造,都孕育“新一代超级平台”

大模型引发“软件变革”,每一次软件大改造,都会出身新的超级平台企业,颠覆原有的数字经济霸主,从Windows、AppStore到GPTs都不例外,当前智能编程助手改变代码生产流程,大型措辞模型成为新一代AGI做事入口、软件调度枢纽。
多篇威信论文显示,大型措辞模型能够面对繁芜任务,灵巧自动实现多软件串行、多模型协同组合,例如AI Agent、MoE架构(Mixture-of-Experts)、综合型智能客服、GitHub Copilot等,能在日常利用中跨模型共享成果、快速学习迭代、增强安全性与伦理性保障。
在弘大AI算力规模、演习数据集根本上,新一代AI原生软件运用,导致“传统软件智能化,智能软件枢纽化”全面遍及,尤其是那些能知足目前还难以预知需求的新工具,新一代青少年将在新兴AI软件与MaaS模型化创新思维逻辑上发展起来,并将新型生产力软件带入办公室与家庭。

趋势九:新一代AI打算架构改造,即将到来

大模型成为社会型公共做事的条件,是“AI打算变革”,在大型措辞模型的Scaling Law(规模定律)指数级算力需求,与线性增长的区域基建投入抵牾下,AI算力根本举动步伐将迎来大量技能工程创新,持续降本增效,普惠上风让AI真正成为赋能千行百业的通用型根本举动步伐,同时“百模大战”变为AI家当专业化分工。
据AI Now《打算能力和人工智能》报告指出,早期AI模型算力需求是每21.3个月翻一番,而2010年深度学习后(小模型时期),模型对AI算力需求缩短至5.7个月翻一番,而2023年,大模型须要的AI算力需求每1-2个月就翻一番,摩尔定律的增速显著掉队于社会对AI算力的指数级需求增长速率,即“AI超级需求曲线”遥遥领先传统架构的AI算力供给,带来了AI芯片产能瓶颈、涨价等短期市场征象。

趋势十:环球AI人才能力培养,成为大国任务

中美构建起环球大模型技能创新的“双螺旋”,新一代人工智能人才培养首当其冲。
据科技部发布的《中国人工智能大模型舆图研究报告》显示,上海市通过发布《上海市推动人工智能大模型创新发展的多少方法》等一系列政策,孵化出17个国产大模型。
纵不雅观国际格局,在AMiner大数据平台、智谱研究发布的《环球人工智能创新城市500强剖析报告》中提出“2023年环球人工智能最具创新力城市排名”,上海的人工智能创新指数进入环球TOP10。
在环球AI创新力城市TOP100中美国33个城市入选,在TOP500里中国42个城市入选。
如何缩小中美之间的差距,须要从K12中小学生、社会职业培训两个方面入手,让大模型走入所有中国学校的教室和家庭,让每一位中国人都能打仗到学习调优、利用国产大模型的课程,着力培养当前和未来的AI工程师。

(作者系商汤科技智能家当研究院院长)