9月19日,2024云栖大会在杭州云栖小镇开幕,这次大会以“云启智跃,家当蝶变”为主题,吸了浩瀚前沿技能企业展示AI时期云上创新的潮流科技。喜马拉雅珠峰AI音频多模态大模型亮相云栖大会,在“人工智能+”主题馆吸引浩瀚市民容身围不雅观体验。
AI(人工智能)已经在深刻影响着我们的生活,也影响和改变着内容创作行业。作为在线音频头部企业,今年成立12年的喜马拉雅以科技赋能文化,环绕音频建立了一个丰富多元的“声音宇宙”,截至2023年12月尾,喜马拉雅已经累积了包含459个品类的4.88亿条音频,总内容时长超过36亿分钟,能知足用户从-1岁到100岁不同年事阶段的不同需求。
喜马拉雅从成立之初就十分重视技能投入,特殊是布局AI,将AI技能打破作为平台发展和演化的紧张驱动力,以便能在不断变革的数字环境中提高自身运营效率及知足用户需求。
在2024云栖大会上,喜马拉雅展示了“珠峰AI音频多模态大模型”(简称“喜马拉雅音比年夜模型”)的强大功能、运用处景及商业化案例。据悉,“珠峰AI音频多模态大模型”是喜马拉雅自主研发的AI音频天生大模型,依托其超百万小时的自有版权音频数据进行深度学习与演习,具备情绪输出、自然表达、语种互译、极速克隆等技能能力,并在音频天生领域实现了多维度打破,正广泛运用于有声书等领域,未来将不断推动音比年夜模型行业的创新与发展。近日,喜马拉雅音比年夜模型已成功通过国家备案。
基于“珠峰AI音频多模态大模型”,喜马拉雅在云栖大会展示了“珠峰AI创作做事平台”:珠峰AI音视频创作平台,依托通义文今年夜模型对文本内容语义的深度理解,打造珠峰AI音比年夜模型,结合喜马拉雅独占的全品类音色库和数字人大模型,为创作者供应高品质的AIGC音频和数智人做事。用户可以在“珠峰AI数智人平台互动体验区”体验AI为声音创作带来的变革,比如极速体验全领域多品类535种AI音色库天生全品类AIGC音频内容、15秒真人数智人形象快速定制、10秒声音极速克隆(不单音色克隆,更包含韵律、腔调、口吻等“语流”信息)等等,感想熏染AI高效便捷地赋能内容创作者。
AI正在深刻赋能和影响着喜马拉雅的发展。数据显示,2023年喜马拉雅全场景均匀月生动用户达3.03亿。截至2023年12月,喜马拉雅平台AIGC内容达2.4亿分钟,占其音频内容的6.6%。同时,喜马拉雅移动端均匀月生动用户的AIGC渗透率已达14.8%。
喜马拉雅音比年夜模型具备“产模一体生态系统、持续进化的生态飞轮”的模型上风,已广泛运用于内容创作、数智分身、语音交互等场景,并已实现商业化。
喜马拉雅音比年夜模型在广告领域拥有广泛的运用处景,通过AIGC原生声音流,实现“广告即内容”,如喜马拉雅联合贵州茅台推出“单田芳AI声音重现”春运公益活动,联合慕思共同打造的“邀李白共启AI穿越之旅”活动等等。基于大模型,未来喜马拉雅的AI能力将在智能化广告营销中发挥更突出的浸染。
喜马拉雅布局AI有其天然上风。众所周知,高质量的数据集是将AI塑造成可靠的阐明器的演习燃料,从弘大的数据集中探索并得到故意义的见地以推动AI不断发展。据灼识咨询资料显示,喜马拉雅拥有中国最全面的音频内容生态,个中包括体量最大的音频内容库及数量最多的音频内容创作者。截至2023年12月,喜马拉雅拥有约4.9亿条音频内容,总内容时长为36亿分钟。这使得喜马拉雅在AI时期能够轻松获取海量且多样化的在线音频内容以不断演进其AI能力,这也是喜马拉雅在AI时期的竞争上风。
AI不仅代表了一种技能代价的想象,其背后更是商业代价的全新拐点。随着下一代技能、AI及大数据能力的持续提升,喜马拉雅将进一步打开声音的想象力,持续用声音分享人类聪慧,用声音做事美好生活。