就在最近,全公司都为这个大闹天宫MBTI测试炸了锅了。

没想到啊,偌大一个公司居然隐蔽着这么多i人?

只见工位上的每个人都两眼放光,满怀期待地上传了自己的「美照」。

下一秒,就可以等待转生,进入天宫了!

全员i人大年夜闹天宫MBTI测试全公司炸锅国产大年夜模型团队出手

当然,AI会为你全新打造一个进入天宫的形象。
聪明的读者已经看出来了,角色画风便是来自《大闹天宫》……里的猴儿。

进入天宫之后,欢迎我们的便是一大波MBTI测试。

测试中的这些场景,分分钟让人惊出一身冷汗。
显然,这便是个危急四伏的「大闹天宫」版当代职场啊!

刚刚上任判官,你就在凌霄宝殿上发起引入KPI,众神哗然。

仿佛已经感想熏染到了同事们的去世亡瞩目。

欠妥心听到同事在抱怨领导,你是上去好言相劝,还是伪装无事发生悄悄飘走?

在职场中面对同事,你是东风化雨,还是铁面无私?

路见不平是当场拔刀合作,还是先远而避之,查明原委后再出头?

同事虚报数据,你创造了之后会怎么办?

这些场景,则是对i人和e人的灵魂拷问。

当着浩瀚公司前辈的面,领导让你上台发言,你怎么办?

遇见多年不见同事,你会激情亲切搭讪,还是装没瞥见?

公司聚餐忽然被领导cue上台,你会像小范大人一样,殿前醉吟一首《将进酒》吗?

8道测试题后,你就会知道自己适宜天庭的什么岗位了。

绝大多数同事,居然都是i人。

互助上影,更懂中国风的图像天生大模型来了!

或许你已经创造了,游戏中的画风透露着一股浓浓的国风味,仿佛跟童年的影象似曾相识。

没错,这个名为「AI+大闹天宫」的互动游戏,是阶跃星辰的一次惊喜跨界,合为难刁难象便是创造了无数中国人童年回顾的上海美术电影制片厂。

2024年,正值上影代表作《大闹天宫》制作完成60周年。

为了纪念这个里程碑式的国民动画片,阶跃星辰与上影携手,进行了一次AI和内容创作领悟的极致探索。

当AIGC、大模型技能和传统的中国动画结合,会碰撞出若何的火花?

在WAIC现场,一家国产AI初创黑马——阶跃星辰给全场不雅观众送上了这样一份大礼。

途经的参展群众对这个游戏爱不释手,现场火爆至极。

而在游戏的背后,阶跃星辰调用了多款自研的Step系列大模型,并领悟了图像理解、风格迁移、图像天生、剧情创作等多种能力,丰富立体地展现了行业领先的多模态水平。

当最前辈的AIGC技能与《大闹天宫》情境深度领悟,维妙维肖的效果加上个性化的交互过程,换了谁都得深深感叹一句:爷青回!

还等什么,赶紧扫码体验吧!

不仅仅是这款「AI+大闹天宫」,Step-1X中融入的「国风」元素随处可见。

为了打造更理解国人审美的图像天生模型,Step-1X在演习过程中结合了当下的「国潮」,对中国元素进行深度优化,让AI天生的内容也能呈现高质量的「中国风」。

攀登AGI顶峰,万亿参数和多模领悟缺一不可

大模型发展到了本日,所有的业内人士都发出了这个疑问:Scaling Law到头了吗?

从下图看,至少在未来几年,Scaling Law仍会见效。

在阶跃星辰创始人姜大昕看来,接下来,依然是模型参数量决定模型能力上限,而Scaling Law全面迈入万亿参数,便是通向AGI的另一核心了。

现在到处都在说AGI,但哪条是通往AGI的坦途,业内大佬一向辩论不一。

在LeCun看来,LLM完备是把全天下带向了歧途,摧残浪费蹂躏巨大的算力资源在现有的LLMs上,远不如新想法和新架构更有效。

但更多大佬,显然对目前的路线十分乐不雅观,Sam Altman、马斯克、Anthropic联创&CEO Dario Amodei、DeepMind创始人Hassabis,都认为AGI会在未来十年内发生。

前OpenAI研究员看来,2027年实现AGI的可能性极大

而姜大昕认为,多模态理解和天生的统一,是通向AGI的必经之路。

第一阶段,措辞、视觉、声音不同模态独立发展,模态之间没有关系,每个模型所要做的是学习如何更好地表征各自模态的特点。

第二阶段,多种模态已开始走向领悟,然而领悟并不彻底,紧张缘故原由正是理解任务、多模天生任务分开,造成模型的理解能力强但天生能力弱,或者反之。

第三阶段,则是将天生和理解统一在一个模型里。

当多模态理解和天生统一后,就可以和「具身智能」结合起来。
把模型作为机器人或者一个设备的大脑,让它去探索这个天下,与天下进行交互。

国产黑马,连甩三个更新

正如上文所述,要攀登AGI的高峰,「万亿参数」和「多模」这两大抓手,二者缺一不可。

而这些,也共同组成了Step系列模型的核心亮点。

既一年肝出万亿参数MoE后,这家年轻的初创再度开启「硬核模式」,一口气连甩三个更新——

Step-2万亿MoE措辞大模型正式版、 Step-1.5V多模态大模型、Step-1X图像天生大模型。

要知道,就在3月份,阶跃星辰才刚刚发了3个模型,间隔本日3个新模型的发布,才区区100天。

Step-2大措辞模型

Step-2大措辞模型光是在参数规模上就达到了万亿级别,直接跻身国际顶尖模型的行列。

在数理逻辑、编程、中文知识、英文知识、指令跟随等方面,Step-2的能力和利用体验可以全方位逼近GPT-4。

从千亿模型扩展到万亿参数,并不是大略的「大力失事业」,而是须要跨过技能上的「分水岭」,对各个维度的哀求都是水涨船高。

一旦个中任何维度涌现短板,Scaling Law都将不再适用,涌现「只投入,不产出」的尴尬局势。

为了训出刁悍的Step-2,技能团队在算法和系统方面都做出了大量的关键创新。

自主研发,全面创新

阶跃星辰创始人姜大昕博士表示,模型扩大到万亿级别时,MoE险些是必选项,这是权衡了性能、参数量、演习本钱、推理本钱等各个维度后的最佳选择。

要演习如此大规模的MoE模型,有两条路可走:一是将已有模型进行向上复用(up-cycle)。

这个方案最大的好处,就在于省钱省力,算力需求低、演习效率高,但会限定模型能力的上限,随意马虎造成比较严重的专家同质化。

为了达到最优性能,阶跃星辰团队选择迎难而上,没有采取第一种方案,而是完备自主研发,从头开始。

Step-2的架构中采取了部分专家共享参数、异构化专家等一系列新颖的设计,充分利用万亿参数。

虽然在MoE架构中,每次演习或推理只会激活部分参数,但背靠万亿总量,激活的参数量也能超越大部分稠密模型。

当参数增长到万亿级别时,演习效率至关主要,这离不开高效且稳定的系统支配。

高效,意味着GPU的利用效率高,让有限的硬件输出最多的算力;稳定,意味着演习过程须要持续进行,不能轻易被故障打断。

系统的稳定有多主要?

纵然每张GPU昼夜一直连续跑两个月才涌现一次故障,放在万卡集群中,相称于均匀每10分钟就有一张卡出问题。

如果没有自动的故障检测和规复机制,每张卡出问题时都要规复检讨点、重启演习,不仅工程师不用睡觉了,模型的演习周期更是成倍拉长。

在Step-2演习过程中,阶跃星辰的系统团队打破了 6D并行、极致显存管理、完备自动化运维等关键技能,从高效、稳定两个层面同时发力,才能在3个月的韶光内发布新模型。

Step-1.5V多模态大模型

而多模态大模型的发布,则表示了阶跃星辰在多模理解和天生统一的技能路线上的快速打破。

这一次,以万亿参数的Step-2为基座,阶跃星辰演习出了千亿参数的多模态大模型Step-1.5V。

可以说,能做到如此理解能力的多模态大模型,在海内并不多见。

创新图文混排演习,让感知能力全面up

识别繁芜的图表、流程图一向是多模态模型的著名难点。
演习过程中,研发团队创新了「图文混排」的方法,成功战胜了这个问题。

Step-1.5V不仅能游刃有余地准确理解各种图像,处理超高分辨率和极限长宽比也毫无障碍。

不仅如此,模型还从二维图像的演习中发展出了三维的空间能力,能从一张图片中感知到物理空间和物体的几何位置。

万亿参数模型当老师,推理大幅提升

有了万亿参数模型当老师,Step-1.5V推理能力的提升也很惊人。

根据图像内容,它进行各种高等推理任务,解答数学题、编写代码、创作诗歌都是一绝。

视频理解超神,人物感情精准识别

此外,Step-1.5V的视频理解能力也相称出色,做到了智商、情商同步提升。

对视频中涌现的人、物体与环境,Step-1.5V不但可以准确识别,还「呈现」出了高超的共情能力,稳稳get到整体氛围和人物感情。

Step-1X图像天生大模型

在多模态这条道路上,完成了感知和理解,下一步便是高质量的天生了。

本届WAIC大会上,Step-1X图像天生大模型首次公开亮相,在多模理解和天生统一的技能路线上连续快速打破。

全链路自研DiT

Step-1X采取了团队全链路自研的DiT架构,将扩散模型与Transformer相结合,且发布了600M、2B、8B等3种不同规格的版本,完美适配不同场景下的天生效果和推理效率。

当前的图像天生领域,可控性是一大难点,纵然是DALL-E、Stable Diffusion这样的有名模型,也很难让图片虔诚于用户的提示哀求。

Step-1X为此进行了特殊优化,重点发力模型的语义对齐能力,实现更好的指令跟随。
让图像天生做到「执法如山」,让视觉效果离我们的想象更进一步。

荣获WAIC 2024 SAIL之星

作为天下人工智能大会的最高奖项,Super AI Leader的评比非常激烈:不仅吸引了浩瀚国内外互助机构,席卷了大批优质创新项目,而且今年的国际项目数量更是创下新高。

而阶跃星辰则凭借着Step系列通用大模型在技能上的创新和广泛的运用落地,荣获了WAIC 2024 SAIL之星的称号。

AI运用与生态

有了模型之后,接下来就到运用阶段了。

对付二者的关系,创始人姜大昕博士的比喻非常有趣:模型是灵魂,运用是皮囊。
好看的皮囊千篇一律,有趣的灵魂万里挑一。

两款C端大模型产品「跃问」和「冒泡鸭」,便是阶跃星辰交出的最好答卷。

AI问答助手跃问:https://yuewen.cn

AI互动平台冒泡鸭:https://maopaoya.com/

从团队成立的第一天开始,姜大昕博士就确定了模型和运用「双轮驱动」的计策。

在微软的多年履历让他深知,模型须要运用作为牵引、补充数据,运用也须要深度绑定模型。
只有加持硬核模型,运用才能做到极致。

「AI+大闹天宫」让我们看到了团队的产品创意,而支撑起AI运用的「灵魂」——Step系列大模型,则是团队对付攀登Scaling Law的一系列成功践行。

最低调的AI创业公司

阶跃星辰这个名字,在AI从业者听来大概有一种说不清道不明的熟习感。

没错,这四个字的确与人工智能有着深厚的渊源。
创始人表示,起名的灵感来自阶跃函数(Step Function)——神经网络中最早的激活函数。

激活函数那么多,为什么独独青睐阶跃函数?

一方面,「阶跃」本身就有跳变、跃迁、超线性增长的意思,代表着AI行业的飞速发展。

另一方面,也会让人想到step by step这句话,仰望星空的同时脚踏实地,踏实地做妙手上事情,已经内化为公司基因中不可分割的一部分。

阶跃星辰,寓意着以阶跃之力,赴星辰大海。

但你可能会非常迷惑,明明技能实力如此强劲,怎么公司名字却险些没听说过?

早在一年多以前的2023年4月,阶跃星辰就正式成立。
但在「百模大战」风起云涌、各种大模型层出不穷的那一年中,团队却一反常态地选择了「隐身」。

没有大肆宣扬造势,蛰伏一年研讨技能,直到沉淀出有强劲实力的模型,不鸣则已、一鸣惊人。

今年3月,Step-1和Step-1V大模型横空出世,惊艳了海内所有的AI从业者。

距上次发布刚过去短短的三个月,我们就看到了又一轮技能更新的成果,模型能力全方位提升。
这种迭代速率,纵然是在初创公司行列也是压倒一切。

阶跃星辰这种低调研讨技能的风格,与核心创始团队有密不可分的联系。

公司创始人及CEO姜大昕博士曾任微软环球副总裁,微软亚洲互联网工程院首席科学家,同时也是算法团队的卖力人。

自成立起,阶跃星辰就做出了综合布局,武断地相信Scaling Law且集中全力投入。

下一步操持

万亿+多模可以说是2024大模型格局的分水岭。
推出万亿参数模型后,阶跃星辰的下一步会怎么走?

创始人姜大昕曾在采访中表示,希望模型朝着AGI方向努力,一是参数规模进一步扩大,二是从能力上,能够真正统一多模态的理解和天生。

团队所武断崇奉的Scaling Law会有失落效的一天吗?

姜大昕博士认为,Scaling Law在肉眼可见的未来还不会触顶,我们至少还可以连续攀登一个数量级。
AGI 是阶跃星辰注定踏上的征途,也必将到达。