编辑 | 苏建勋

若将中国的AI发展看做是一本小说,你会创造,2023年用一页的篇幅,几近写完了曾经打算机视觉(CV)的三年:起风,落地,再到危急暗涌。

2022年末,太平洋对岸的ChatGPT石破天惊,拉开了名为AI大模型的环球竞速——热钱和人才集中涌向这个赛道。

这一年,中国模型层一共出身了5家独角兽:智谱AI、MiniMax、百川智能、零一万物、月之暗面。
无论是从头训,还是基于现成模型微调,海内约200个大模型加入“百模大战”,AI领域融资事宜数比2022年增长了145%。

2024 AI 瞻望OpenAI再打响指我们还能期盼什么

AI的技能打破,也为这个赛道吸纳了不少顶尖人才:来自国内外最高学府的有名学者教授下海,互联网老兵出山,谷歌、微软等外洋大厂出身的华人返国。

但与热闹和振奋民气的技能打破相对的,是疲软的成本市场和紧缺的资源。
美元基金的退出、英伟达芯片的禁运,倒逼AI企业内修功力、外寻新机:找场景快速落地,出海拓展商业机会。

从熬炼技能,到快速的商业化落地,也将更为抽象的问题摆到AI厂商面前:如何找准落地场景?如何实现数据飞轮?

从Copilot到AI Agent(智能体),热门观点和demo的不断呈现,让市场对AI的能力充满了想象。
但较为残酷的现实是,囿于底层模型的能力,AI能落地的场景仍旧有限。

从模型层干系的多模态、幻觉问题,到硬件层面的NPU(神经元打算处理器),AI家当高下游要办理的技能难点还有很多。
对付运用厂商而言,则要根据技能现状将落地场景加以细分,或者找到具有独特代价的落地场景。

即便度过了机会和危急并存的2023,没人疑惑,2024年,AI依然会是舞台上的主角。

开年的“王炸”,依然来自OpenAI——北京韶光2024年2月16日,OpenAI推出了可以天生60秒连贯流畅、超逼真的高清视频的视频天生模型Sora。
对付不少视频模型的创业公司而言,“灭霸”OpenAI的开年响指并不好受。
但业内更多人认为,视频等多模态模型,将在2024年创造新的商机。

而市场,也已经做好了欢迎AI商业化的准备。
经历三年疲软的消费市场,在2023年Q3终于复苏。
在硬件层面,手机、PC等消费电子的销量回升有目共睹。
在软件运用层面,根据移动市场剖析平台data.ai的统计,2023年环球移动市场用户的支出同比增长了3%——截至2023年末,天生式AI运用的月用户支出也打破了1000万美元。

2023年下半年以来,出海淘金,也成了不少AI厂商拓展商业机会的办法。
无论是在新环境中寻求成本,还是探求具有更高付费能力和意愿的客户,不少海内的AI厂商提起出海,都给予36氪同样的答复:“Why not?”

2024年,关于大模型的机会、运用落地的方向、做ToB还是ToC、本地化还是出海,36氪总结了6大趋势。

一、措辞日渐拥挤,视听乘风起势

即便模型层短韶光内出身了5家独角兽,但企名Pro的数据显示,2023年AI领域的融资总额比2022年少了4.5%,乃至还不到2021年的一半。

这意味着,热钱集中地涌向了少数团队背景和技能实力强大的公司。
从资源分配的角度而言,后来者想要再挤进模型层创业,空间已经不多。

智谱AI CEO张鹏认为,从商业竞争的角度而言,2024年LLM赛道已经靠近红海:“一,算力等资源紧张的问题还没有办理;二,从市场空间的角度而言,不须要重复造轮子;三,模型能力很大程度上依赖先发上风,积累用户反馈、行程数据,从技能迭代的角度,后来者很难跟上主流的水平。

即便零一万物内部的模型演习研究显示,模型参数量还有很大的提高空间,在零一万物技能副总裁、Pretrain(预演习)卖力人黄文灏看来,目前模型层的困难紧张是在算力资源上:

“从GPT3.5到GPT4有大量的技能寻衅要办理,算力资源限定会减少迭代试错的机会,大家都会选择确定性较高的路径,就错过了一些创新的机会。

红海中,永恒不变的只有顶级人才的号召力。
远识成本董事Yuca对36氪表示,基金不会把鸡蛋放在同个篮子里,OpenAI、微软、谷歌这些顶级公司的华人专家,还存在撬动海内资源的可能。

LLM赛道日渐拥挤,但3D、视听等多模态模型仍是一片蓝海。

月之暗面联合创始人周昕宇向36氪列举了不少模型有待打破的底层技能,个中不少与多模态有关,比如如何对多模态数据进行统一表示;如何用打算来打破数据的瓶颈;如何研发出更高效的多模态无损压缩神经网络架构。
他认为,这些技能打破都可能成为2024年模型层公司的机会,但也可能须要更永劫光才能取得打破。

多模态能力的打破,也将给大模型的整体能力带来超预期的提升。
“由于大模型的泛化性,能力迭代每每是通用的、全面的提高,不会是单点的打破。
”黄文灏见告36氪,“无论是图片还是音频,多模态数据会和笔墨形成1+1>2的效果。

不过,3D和视听天生技能在2023年的迭代速率之快,已让人瞥见2024年的商业化浪潮。
以技能繁芜的视频天生为例,2023年初,视频天生模型尚且只能将多个静止的图像拼接成几秒长的剪辑。
但不到6个月,以Runway Gen2为代表的模型就能天生几秒长的电影级影片。

韶光再来到同年11月,由4名华人创立的动画视频天生公司Pika,就释出了可以天生分钟级高质动画视频的产品。
Pika的估值,也飙升至近2亿美元。

而仅仅再过了3个月,2024年2月16日,“灭霸”OpenAI又杀去世了视频天生的游戏,发布可以天生60秒连贯高清视频的文生视频模型Sora。
这也意味着,视频天生模型间隔商用,已经近在咫尺。

LLM办理的是最基本的互换问题,而3D、视听等多模态则能让AI模型拥有超人类的感官,运用创新和模式创新的机会远多于LLM。

多模态技能能落地的场景,大致可以分成两类:一类是供应生产力工具,另一类则是供应新场景。

在事情和生产场景下,模型做事的商业模式已经较为成熟,但这也意味着入局者浩瀚,竞争压力更大。
企业的核心竞争力在于能否建立全流程做事,知足用户的细分需求,同时形成数据飞轮。

随着多模态技能的提升,不少人在智舱、物联网、XR等场景中看到了新机会。
对付新场景的创业者而言,跑通商业模式的先决条件,则是探求到具有独特代价的细分场景。

二、模型“瘦身”,先场景后模型

但通用基座的红海,并不虞味着模型层已经失落去入局的空间。

一个明显的趋势是,随着运用落地的加速,不少中小模型厂商开始“瞄准钉子挥锤子”,先找到能落地的细分场景,再针对性地演习模型。

这一征象,与市场的反馈不无关系。
运用落地的急迫性,让下贱厂商比起更强大的通用性能,更关怀模型调用的本钱,以及在端侧支配的可能性。

由于模型推理须要花费的算力巨大,来自底层的本钱压力会层层传导至下贱。
以OpenAI为例,根据美国金融公司 Bernstein 的剖析,如果ChatGPT的访问量达到谷歌浏览器的十分之一,OpenAI 初始须要的GPU代价高达481亿美元——这部分的本钱也势必会分摊到下贱的运用厂商。

降本最直接的办法,是减少模型的参数量。
2023年下半年以来,不少拥有千亿级参数基座的模型厂商,都发布了十亿级参数的模型。
比如百川智能发布了7B的措辞模型,智谱AI和零一万物发布了6B的模型版本,用纯CPU就能将模型跑起来。

但光“瘦身”,不敷以成为模型厂商的竞争力。
其缘由在于,各家大模型的能力尚未产生明显差距。
远识成本董事Yuca举了一个例子:在国外,所有运用厂商优先考虑的模型一定是GPT-4;但在海内,运用厂商挑不出一个出类拔萃的,一样平常会考虑把十几个主流模型都先试试。

“现在谈大模型的竞争力还为时尚早。
”网易有道CEO周枫对36氪表示,“核心是要从运用中找到千亿级的市场机会,找到‘大模型原生’的产品形态是关键。

他以有道的长项翻译场景为例,虽然有道自研的百亿参数模型“子曰”整体对话能力不如千亿参数的ChatGPT,但通过基于向量数据库的演习,“子曰”能够5秒翻译67页长论文。

即便认为“现在谈大模型的竞争力还为时尚早”的判断还有待商榷,智谱AI CEO张鹏在模型落地层面,表达了类似的不雅观点:“落地阶段最主要的是找对场景,培养用户,形成数据飞轮。

培养用户,越早越好。
月之暗面联合创始人周昕宇见告36氪,重新技能的扩散曲线来看,最早期的用户和开拓者会带动更多的用户:“2023年可以吸取的履历教训是,该当更早点儿给用户去用,很多用户自己会探索大模型产品的边界,创造产品经理想不到的场景和运用。
2024年,AI落地的重点是如何与用户一起发展。

一个通过找对场景,顺利在模型层霸占一席之地的范例案例,是估值达5.2亿美元的AI公司Perplexity。
Perplexity通过将大模型和搜索引擎结合,开拓出了类似于New Bing的对话式搜索引擎。

不过,Perplexity的模型,最初是基于一些规模更小、推理更快的模型进行微调而来。
直到最近,他们才开始演习自己的模型。

对付前期“套壳”的决定,Perplexity CEO Aravind Srinivas在播客节目中锐评:“成为一个拥有十万用户的套壳产品,显然比拥有自有模型却没有用户更有代价。

不过在未来,自训模型仍旧会成为AI运用企业不可缺失落的一环。
“AI公司的核心竞争力会是模型、运用、infra‘三位一体’的能力。
最大的运用公司必须节制模型演习能力,模型的推理本钱降落对运用是最大的提升。
三者缺一不可。
”零一万物技能副总裁、Pretrain(预演习)卖力人黄文灏对36氪表示。

三、可穿着,家居……AI托举细分硬件

2024年,将是AI硬件元年——这一判断,已经涌如今国内外不少厂商的年初展望中:

高通总裁兼CEO Cristiano Amon在接管媒体采访时表示,2024年将成为环球AI手机元年;遐想集团CEO杨元庆将2024年视为“AI PC出货元年”;OPPO高等副总裁刘作虎在发布会上直言:“2024 年,不布局大模型的手机企业未来没戏。

不少硬件厂商,将AI大模型视作消费电子低迷三年后的一根“救命稻草”。
但厂商们将AI从云端转移至终端设备,有着更为现实的考量——在大模型和终真个适配标准尚未建立之时,押注下一个入口型智能硬件,争先建立继IOS、安卓、Windows之后AI OS(操作系统)。

比如1月10日,光彩发布了新一代AI系统MagicOS 8.0,用“端云协同”作为AI生态的卖点。
在CES(国际电子消费展)上,遐想透露估量在2024年内发布“智能终端AI OS(操作系统)”。
“Windows老家”微软,也宣告将AI助手Copilot键引入Windows 11 PC,并将其描述为“AI PC的第一步”。

但无论是PC、手机,还是汽车,这些具有繁芜软硬件生态的智能终端,与大模型的结合仍旧差一口气。

其一,被授予“高效率、低能耗”厚望的硬件“大脑”——NPU(神经网络处理器)芯片,仍处于研发初期。
大模型接入智能终端后,能耗和运行效率问题依然难以办理。

其二,囿于大模型能力和硬件分歧一的适配协议,AI在智能终端上能落地的场景仍旧有限。
面壁智能CTO曾国洋见告36氪,终端标准协议的建立,是环球软硬件厂商之间的博弈,很难预判胜者是谁。

相对地,瞄准垂直场景的设备,在结合AI模型后反而迅速开辟了市场。

在作为“科技市场风向标”的北美,AI硬件迅速崛起的消费趋势已经证明了这一点。

比如在CES 2024首秀的橙色盒子Rabbit R1,可以代理人类完成对手机的操作。
发售首日,第一批的1万台机子就迅速售罄。
在北美电子产品购物平台ebay上,乃至有人加价几百美元,靠拍卖Rabbit R1谋利。

Rabbit R1

事实证明,只要捉住用户的痛点,再垂直的场景都能带来巨大的财富。

比如AI+戒指——售价349美元(约2507.31元)的AI戒指Gen3,主打康健检测,其母公司OuraRing估值高达25.5亿美元;

AI+跑鞋——由AI驱动的跑鞋Moonwalker,能够在不改变正常步辇儿办法的情形下将步辇儿速率提高250%,即便预售价高达999美元(约7177.09元),在Kickstarter上也有570人参与众筹,募款额达到目标金额(9万美元)的近6倍;

AI+徽章——得到微软和OpenAI投资的Humane,推出了一款内嵌GPT的AI别针AI Pin,主打通过手势交互调用通讯、搜索、播放音乐平分歧功能,预定量已经超过450万台。

AI Pin的搜索功能

以北美为鉴,不少业内人士认为,康健监测、家庭陪伴等被北美市场验证的场景,在2024年会立时在海内被复制。

而在具有中国特色的场景中,最被看好的则是学习和翻译。

回答的准确率,以及感情代价的供应,一贯是大众对AI传授教化、翻译能力的紧张质疑点。
但真金实银是最真实的市场反馈:接入“星火大模型”后,讯飞学习机、智能办公本、翻译机等产品在双十一全周期内发卖额同比增长126%;网易有道首款搭载大模型功能的有道词典笔X6 pro,产品首发日销量超4万台,开学季发卖额超1亿元。

在远识成本董事Yuca看来,在学习场景下,中国用户天然处于已经被教诲好的状态:学习硬件的用户画像紧张为中小学生群体,这一群体的特色是乐于接管AI科技等新鲜事物,且对授课办法敏感度不高。
在知识类数据库(比如教材、真题)较为透明的情形下,AI的准确率也得以担保,乃至稳定性高于人类西席。

而AI翻译产品可辐射的用户,比学生更广。
Yuca认为,随着旅游市场复苏、签证门槛放低,跨国交流成为刚需。
随着AI能力的发展,耳机平分歧形态的翻译设备也将率先走入口音/特定声音识别能力、同传速率这两个沙场。

“个性化剖析和辅导、勾引式学习、全学科知识整合。
”谈及AI能给学习硬件带来的新机会,网易有道CEO周枫认为有三点。
在教诲场景中,这些功能的提升原被认为只有人才能做到,而随着多模态能力的提升、Agent的发展,大模型在细分场景中更具有“拟人”的能力。

四、留住用户,拼全流程做事

2023年,不少AI运用快速起高楼,又迅速如昙花一现:

供应文案、图片天生等AI营销工具的Jasper,在2022年底估值一度高达15亿美元,拥有100万总用户和7万付用度户。
但仅过了半年,Jasper用户量锐减,面向员工的股票估值打了8折,并开启裁员;

在海内红极一时的AI写真天生运用“妙鸭相机”,高峰期排队人数高达4000-5000人,等待韶光要十几个小时。
但根据七麦数据,上线不到4个月,伴随着创始人的离职,妙鸭相机在IOS“社交”运用榜单上的排名,从榜首一起下滑到60开外。

不少AI运用都难以逃脱“倒U型”用户量曲线的魔障。
其核心缘故原由有二:底层技能没有壁垒,同质化产品易复制;做事链条短,用户难以对工具生态产生依赖。

外洋头部AI图像天生运用下载趋势,图源:Sensor Tower

“像妙鸭一样的AI软件运用,可以通过奥妙的营销或者获客办法快速起量。
但想要坚持用户增长,超越美图、Photoshop这样的产品,核心在于妙鸭们能否将做事,快速迭代到全流程的水平。
”远识成本董事Yuca向36氪举了个例子:

妙鸭相机通过更风雅的AI写生天生技能,快速聚拢了一波用户。
但妙鸭的做事链条仅限于照片天生,具有修图、编辑等需求的用户,又会回到美图和Photoshop的做事生态。

AI运用的用户留存思路,实质上与任何产品的发展并无二致:找到一个办理刚需的场景,完善全流程的做事链条,不断迭代更新IP,拓展利用场景。

找场景和IP迭代,可以被视作产品不同发展阶段的流量入口。
比如在《芭比》电影上映期间,AI写真小程序“45 AI”,靠首发芭比模板在两天内聚拢了2万多用户,美图秀秀等老牌美图软件也紧随其后上线芭比模板。
而春节将至,ChatMind、MiniMax等团队也快速在AI社交产品上,针对年轻人更新了亲戚拜年的闯关场景。

对不少产品来说,找到得当的流量入口不难,但用全流程做事和更广的场景承接流量并不大略。

例如,线上做事,须要从知足单点功能,延伸到涵盖利用前、中、后的全流程,比如针对想要体验写真天生的用户,企业还要知足他们后续修图、美颜的需求。
当线上做事场景已经涵盖全流程,就要考虑往线了局景延伸,比如将AI功能嵌入多形态的硬件设备中。

在用户留存层面,2023年能带给2024年的履历教训是:靠一个强大的AI功能并不能一劳永逸。
毕竟,人类专业拍照师也难求一稿包过,根据用户的需求后期精修才是常态。

五、用To C的思维,做To B做事

2023年,大模型落地很快产生了To B和To C的分野。

选择To B场景,大多离不开企业基因和商业化两个缘故原由。
智谱AI CEO张鹏谈及选择To B的缘故原由,是公司成立初期已经原始积累了一批企业客户资源,“To B是商业化能够比较快跑起来的路子”。

选择To B或是To C,也有产品迭代和建立数据飞轮的考量。
作为为数不多武断To C的大模型公司,月之暗面的情由是:迭代效率。
月之暗面CEO杨植麟曾在公开采访中表示,这是一个“以终为始”的选择,月之暗面的“终”是探索智能边界,做个性化,反推适宜的人才构造、产品策略的“始”,便是To C。

“从长远来看,成功的商业策略应该是To B与To C并重,构建起既能知足企业和组织需求,又能贴近广大消费者的产品和做事生态体系。
”零一万物技能副总裁、Pretrain(预演习)卖力人黄文灏见告36氪。
在他看来,To B和To C业务对模型迭代能力的影响各有侧重。

“常日来说,To B业务因其专业性强、定制化需求多等特点,在企业做事方面已经相对成熟。
To B业务网络数据的速率虽然较慢,但所处理的数据常日更为构造化、质量更高,对付特定行业知识的学习与积累有着不可替代的上风。
”黄文灏表示,“而To C业务,由于用户基数大、交互频繁且运用处景多元化,确实更随意马虎形成数据飞轮效应。
同时,由于消费者对新技能接管度高,创新扩散速率快,从而吸引更多的新用户,形成良性循环。

然而在模型落地的实际过程中,不少厂商创造,To C和To B的边界正在逐渐模糊。

智谱AI CEO张鹏见告36氪,大模型To B和以往的To B做事模式并不同。
以往的B端做事,紧张知足的是来自企业的业务流程标准化的需求。
但大模型的智能能力提升后,企业对To B做事的需求,扩展到了事情提效、员工助手、知识培训等聚焦于个体做事的场景。

“即便是做业务干系的AI Agent,终极的用户是员工个体,做事的实在还是C端群体。
”张鹏阐明。

什么叫做To C思维?在月之暗面联合创始人周昕宇看来,“用户会为对自己有帮助的产品直接买单。
”与传统To B倡导做事的标准化不同,To C做事须要知足不同用户的个性化需求。
乃至于,To C产品须要根据用户的利用习气进行不断迭代,个性化的迭代会贯穿用户完全的利用周期。

不过,对付To B模型厂商而言,想要长久盈利,就必须供应标准化做事。

远识成本董事Yuca认为,海内数字化预算紧张集中在大客户手中。
目前对大模型厂商而言,做事大客户的定制化做事利润最高,但付出人力韶光本钱高,回款周期长,且只有极少部分大客户能够承担。

不少To B模型厂商,开始探求能实现个性化做事的标准技能路径。
比如,国内外已有不少厂商在To B大模型做事中引入RAG(检索增强天生)流程,实现对企业的个性化做事。
RAG就好似大模型与企业私有数据库之间的“传声筒”,随着私有数据库的更新,相应的模型做事也会随之更迭。

2024年,To B模型厂商捉住金字塔尖的大客户依然主要,Yuca补充,“不同ToB行业有极高的行业壁垒,如何切入高行业壁垒的大客户也是须要思考的问题”。
但位于塔身的广大客群,是目前To B模型厂商立身的富矿。

六、出海,淘金

如今,出海成了不少海内AI厂商无奈又为之振奋的决议。

中国互联网公司的外洋AI产品

无奈,更多来源于对资源的内忧外祸。

在美元基金退出、芯片供应受阻的大背景下,AI厂商在海内融资、演习模型的难度骤增。
据不完备统计,在海内,2023年上半年融到钱的大模型企业大概有20多家,但下半年数量骤减至不到1/2——钱早已涌向了少数大模型的早期玩家,后来者的处境并不乐不雅观。

站在基金的角度,远识成本董事Yuca见告36氪,由于时局并不明朗、IPO充满不愿定性,基金更在意如何在IPO前顺利退出,并且从中获利:“外洋市场收并购相对海内成熟,出海项目存在收并购可能性较海内高很多,比较走IPO的独木桥,对基金来说退出更随意马虎一些。

相较于海内,外洋,尤其是北美,企业之间的收并购更为常见。
据数据剖析公司GlobalData统计,在2016年到2020年期间,苹果一共收购了25家AI公司,谷歌收购了14家,微软收购了12家。

被这些大厂收购后,创业者依然能够选择二次创业。
比如,曾为苹果员工的Adam Menges,在创办的两家公司分别被微软和Niantic收购后,他又加入了AI设计初创企业Visual Electric,得到了红杉的投资。

而出海更令人振奋的起因,莫过于外洋有着近中国14倍规模的AI市场。
IDC的报告显示,2022年中国AI软件市场规模为307亿元,环球则为640亿美元(约4606.4亿元)。

同时,在环球本钱差异不大的条件下,由于付费能力和付费意识的差异,同样产品在外洋的利润率将高得多。
以Apple Music为例,同样的音乐做事,美国的订阅费是10美元/月(约71.93元/月),是中国订阅费(10元/月)的7倍。

至于模型做事,智谱AI CEO张鹏认为,外洋客户对标准化的接管程度更高,但海内客户更方向于选择定制化,这导致模型做事在海内的ROI(投资回报率)并不高。
不少受访者的不雅观点是,只要能和OpenAI、微软等大厂形成做事或者价格上的差异化上风,出海对付To B模型厂商而言能够拓展更多商业机会。

此外,一个不得不承认的事实是,海内大模型与GPT-4的客不雅观差距仍旧存在。
但目前,GPT-4等部分高性能模型无法进入海内市场。
在外洋,依托于更高性能的模型底座,AI厂商能够实现更多的运用创新和模式创新。

在与国外厂商技能差距可控的条件下,中国AI厂商出海的天然上风,则在于对渠道和价格的把控能力。

对付AI软件厂商,尤其是To C运用而言,经受海内社交+电商+视频三位一体的繁芜获客渠道的捶打,面对国外以亚马逊、Instagram等独立平台为主的渠道生态,就从容了许多。
“能在海内这么卷的渠道环境中杀出来的,在国外一定不会差。
”一名在北美的AI创业者对36氪判断。

对付AI硬件厂商而言,极致性价比依然是收割外洋客户的利器。
即便环球供应链正在往东南亚转移,但核心部件的生产技能专利仍旧把握在中国厂商手中。
AI硬件厂商能够通过供应链上风,在外洋市场把握定价权。

不过,厂商们也要清楚地认识到,外洋市场与海内市场存在不小的差异,这会全方位地影响产品定位、UI设计、演习数据、团队培植。
将本地化产品或者团队1:1复刻到外洋,结局大多是水土不服、铩羽而归。

比如对付AI绘画软件,海内用户偏爱国风模板,但外洋用户则更偏爱漫威和3D。
在海内,To B的AI公司须要建立相称规模的工程化团队,以知足客户的定制化需求,但在标准化接管程度高的外洋,AI公司反而要放更多精力在底层技能打磨,以及建立高水平的发卖团队上。

如今,一批海内大厂已经用AI瞄准了外洋市场,而不少AI初创企业的出海财富故事,也已在业内流传:

由西南财经大学打算机教授段江创立的AI图片编辑软件Fotor,在环球超过5000个AI运用中,2023年9、10两月访问量排名23,月活高达千万;MiniMax旗下的外洋AI谈天软件Talkie,自2023年8月发布以来,就长期位于美国Google Play娱乐运用下载榜前10。

可以预见的是,成功探路的案例越多,AI出海的军队将在2024年愈发壮大。

欢迎互换!