昆仑天工Mureka V8发布:AI音乐进化为第五大音乐品类?

昆仑天工发布Mureka V8,人声告别机械感,AI音乐或成第五大品类。与太和音乐合作,扶持AI音乐创作,开启AI音乐新纪元。

原文标题:刚刚,AI音乐被重新定义!昆仑天工甩出新王炸,拿下全球第一

原文作者:机器之心

冷月清谈:

昆仑天工发布最新音乐大模型Mureka V8,该模型在歌曲的成熟度、可用性以及人声表现上均有显著提升。Mureka V8生成的音乐可以直接作为成品发布,人声告别了“机械式念词”,更富情感和故事性。在与竞品Suno V5的对比中,Mureka V8在旋律性、人声表现力、编曲和情绪表达等主观指标上全面胜出。昆仑天工认为,AI音乐有望成为流行、R&B、嘻哈、摇滚之外的第五大音乐品类,并推出了AI Studio,旨在为专业创作者提供更完整、可控的创作环境。同时,昆仑天工还与太和音乐达成战略合作,为AI创作者提供流量扶持与变现机会。

怜星夜思:

1、Mureka V8声称AI音乐将成为第五大音乐品类,你觉得这个说法靠谱吗?未来的音乐创作模式会发生哪些改变?
2、Mureka V8在人声模拟上取得了很大的突破,你觉得AI人声会取代真人歌手吗?
3、文章提到Mureka的MusiCoT技术让AI能够像人类一样“思考”词曲和旋律,你认为这种“思考”和人类的创作思维有什么本质区别?

原文内容

图片
机器之心编辑部

如今,AI 神曲传播的速度已经远远超出了我们的想象。


在 B 站,有这样一位音乐 UP 主「漫游会议室」,他将《西游记》中的经典人物「请进」录音棚,利用 AI 来填词、作曲。在三个多月时间里,创作出了 30 个作品,大部分都是百万播放量,其中爆火的美猴「亡」更是超过了 1600 万。


一个个为人熟知的荧幕形象,在 AI 的指挥下声情并茂地倾诉自身遭遇,成为了音乐区一个特殊的存在。


图源:B 站 UP 主「漫游会议室」


当然,AI 音乐并不是要取代人类创作者,反而更有可能帮助他们的作品出圈。这个月,FYI.AI 创始人、美国音乐团体 Black Eyed Peas 成员 Will.i.am 在接受采访时表示,「AI 正在为创作者带来一场新的文艺复兴。」AI 的加入使得音乐创作变成了一种人机协作的融合形态。


1 月 28 日,国内 AI 音乐界扛把子昆仑天工,面向全球用户发布了最新音乐大模型 Mureka V8


昆仑万维董事长兼 CEO 方汉


新模型在继续降低创作门槛、推动「人人都能成为创作者」的同时,旗帜鲜明地亮出了 AI 音乐进化为一种新音乐品类的概念。


今晚 8 点,由 Mureka 包揽词曲与编曲的 M:RA 女团主打歌曲《MCE》已经在 QQ 正式上线。同时与太和音乐联合发行了这首歌的 MV,气场十足,感觉一下子就将我们拉进了打歌舞台现场:



向音乐新品类进化的关键前提在于:AI 创作的质量正突破临界点。为此 Mureka V8 在歌曲的演绎上更上一层楼,歌词、旋律、编曲皆有显著的进步,并从以下两大维度进一步优化:


一是,作品的成熟度与可用性。Mureka V8 生成的音乐不再只是实验性片段,而是可以直接作为成品发布,真正成为创作工作流的一部分。


二是,人声的突破。Mureka V8 的人声告别了「机械式念词」,带上了更多情绪与张力,故事感更浓厚,听感更抓耳。


在与 Suno V5 的较量中,Mureka V8 在专业音乐人参评的音乐旋律性、人声表现力、编曲 / 结构、情绪表达与渲染等主观指标上全面胜出,延续了对这个老对手的优势。



在谈到 AI 音乐为何能够进化为一种新品类时,昆仑天工董事长兼 CEO 周亚辉表示,「AI 音乐相较于传统音乐的一大优势是,它能够集成进所有你想要的乐器。AI 音乐有望成为流行、R&B、嘻哈、摇滚四大音乐品类之外的第五大音乐品类。」


周亚辉


上手实测:AI 与真人傻傻分不清楚


进入 Mureka 官网,选择最新的「V8」版本。



  • 全球官网:https://www.mureka.ai

  • 国内官网:https://www.mureka.cn


此前在测试  的时候,我们让它生成过一首《春之舞》,AI 歌手的人声已经很清楚,旋律也不错。更新两代之后的 V8,势必更强,结果也确实如此。


我们让它来创作一首中文歌《冬之殇》,提示词是这样的:


一首深沉、孤寂、充满叙事感的艺术流行歌曲,具有电影配乐般的画面感与情感张力。旋律优美而哀伤,以钢琴和弦乐为主导,搭配缓慢而沉重的节拍,营造出冬日的凛冽与内心的荒芜感。歌词围绕 “逝去”、“遗忘’”、“漫长的告别”、“寂静中的回响” 展开,描绘冬天作为终点与见证者的意象,中文歌词需富有诗歌的凝练与隐喻。


等了不到半分钟,Mureka V8 就生成了一首时长近 3 分钟、名为《冬日的漫长告别》的抒情歌曲:



这一首歌,就几乎将 Mureka V8 的核心亮点囊括在内:


一是结构丰富,从前奏、主歌、副歌,层层递进。同时,旋律与情感彼此交织,主歌旋律起伏较小,语速较慢,情感含而未发。进到副歌,旋律明显拉高并变得开阔,情感张力达到顶峰并倾泻而出。穿插进来的大量「呜~」吟唱给听者留出了呼吸与共情的间隙。


二是歌词的故事性与画面感很强,通过徐徐展开的方式讲述故事,让听者仿佛在翻阅一本旧相册,并置身其中。


三是编曲讲究,尤其是乐器选用和进入时机。整首歌以钢琴为主基调,突出了冬日的冷色调。弦乐的加入又为歌曲增添了厚度。


生成的作品支持二次创作,包括局部编辑、延长与裁剪,赋予了创作者更高的自由度与可玩性。这里我们体验了延长功能,在延续原曲风格的基础上增加了留白:


续写的歌词:冬日终会走远,而这份告别,是写给春天最长的信。


此外,创作完成的歌曲能够即时发布,缩短了从素材生产到成品分发的路径,实现灵感的随创随发。这也是此次 Mureka V8 对音乐生成质量自信的表现。



第一首就这么赞,我们接着让 Mureka V8 来一段欢快的「R&B 情歌」,看它能不能 hold 住。输入以下提示词:


“请以‘暧昧升温 | 微醺时刻的吸引力’为核心场景,生成一首结构完整的当代 R&B 歌曲。要求包含:一段以反拍吉他引入的前奏、主歌部分体现含蓄试探、副歌部分旋律性感抓耳、并设计一个桥段来展现关系突破的瞬间。歌词需要充满双关和暧昧的想象力。”


并且,这次生成增加了一个环节,让它参考周杰伦的《龙卷风》,并选定曲风(R&B)、情绪(欢快)。



结果出来后依旧非常惊艳,R&B 味扑面而来,尤其是人声表现。以往的 AI 人声有时会被吐槽像一个咬字精准但缺少感情的「发声机器」,在听感上游离于背景之外。


现在,Mureka V8 仿佛为人声注入了一个统一而鲜明的人格,像人类歌手那样去「演绎」,情感与歌词以及背后的故事几乎没有脱节,真正具备了主唱气场



最近几年,古风流行歌曲屡屡能够在网络上红极一时。我们也让 Mureka V8 生成了两首不同风格的古风歌曲,先是一首「婉约江南风」:


提示词:生成一首婉约细腻的现代国风歌曲,主题是 “春日离别”。核心意境:烟雨朦胧的江南渡口,折柳送别时的欲说还休。音乐要求:使用五声音阶,主旋律由竹笛和古筝交织呈现,节奏舒缓如流水。结构特色:主歌部分用女性清亮嗓音叙事,副歌部分旋律起伏加大,融入戏曲小腔。编曲融合:背景铺陈细腻的电子氛围音色,搭配零星的中国鼓点,尾奏渐渐加入雨声音效,整体混音空灵而有层次。


再来一首「武侠江湖风」,这里使用了 Mureka V8 的自定义模式,自动为提示词生成歌词,并选定风格与人声。


图片

提示词:电影感中国风音乐,史诗风格,快节奏,厚重的中式打击乐,琵琶与二胡,有力男声演唱,充满英雄气概,武侠风格,管弦乐融合。


气势磅礴、刀光剑影呼之欲出:



下面是一首相同风格的英文歌:



这几首歌听下来,只留给了我一个大大的问号:如果不事先告知,我们真的还能分清它们是 AI 生成还是真人创作的吗?


音乐「思维链」,让 AI 懂得宏大叙事


Mureka V8 让 AI 音乐进一步摆脱了僵硬感、拼凑感、千篇一律以及言之无物等以往音乐生成模型存在的通病。这一切在技术上要归功于昆仑万维自研的「MusiCoT」,一种专为音乐生成打造的思维链(CoT)提示方法


该方法受到了语言建模中 CoT 提示技术的启发,通过一系列创新补上了传统自回归音乐生成模型偏离人类创作模式的短板。


一方面,引入了中间推理,让模型预定义整体音乐结构以及风格、乐器等相关的元素,然后再生成音频 token;另一方面,利用对比语言 - 音频预训练(CLAP)架构来定义音乐 CoT, 在同一个空间中对文本与音频进行学习和训练,让二者匹配度更高。


MusiCoT 整体框架。


从 Mureka V6 开始到今天的 Mureka V8,它们实现 SOTA 效果的背后,都离不开 MusiCoT 像人类创作者一样自主「思考」词曲、旋律、情绪,并形成了该系列模型的技术护城河。


基于 MusiCoT 技术,Mureka V8 不再机械地拼接音频,而是模仿人类创作思维,在理解段落结构、和声推进与情绪铺陈的基础上,让音乐叙事更加完整。


与此同时,人声建模技术是 Mureka V8 能够「告别 AI 味唱腔」的另一大关键因素。


两项技术加持下,AI 在理解音乐生成逻辑的路上更进了一步,不像以往只是一味地把好听的采样硬凑在一起,而开始懂得了铺垫、高潮在内的起承转合,并具备了驾驭宏大叙事的能力。


AI 音乐,被重新定义


一直以来,与其他 AIGC 工具一样,AI 音乐模型被定义为了「辅助创作工具」与「效率提升工具」,可以利用它们激发灵感、批量生成手稿、缩短创作周期。


在很多人看来,AI 创作归根结底是基于训练数据的模仿与重组,而非发自内心的表达。因此,AI 音乐往往被认为缺乏情感与灵魂,并且存在同质化的问题,无法形成吸引人的独特审美。


不过,随着模型与算法的迭代升级,如今的 AI 已经能够生成有深度有温度的作品。此次的 Mureka V8 就是很好的例子,不仅在结构完整性、旋律连贯性、人声拟真性上更强,其整体音乐性、情感表达性也让所有人眼前一亮。


能力上的跃升,驱动昆仑天工提出了更宏大的愿景:推动 AI 音乐成为一种独立的、有辨识度的音乐新品类


这种对 AI 音乐本质的重新定义,势必会带来包括创作主体、内容表达与产业形态在内的联动革新。随之而来,我们或许会进入一个 AI 音乐创作的全新纪元。


在这个新纪元中,人类创作者与 AI 的协同更加强调共生共创,内容表达的边界得到极大拓展,并在打通模型、社区、工具和服务全链路的基础上构筑起一个更加繁荣的消费生态。


写在最后


对于包括昆仑天工在内的所有业界玩家来说,将 AI 音乐打造成新品类既是挑战,也是机遇,拼的就是谁能更早更快地占领这一生态阵地。显然,昆仑天工走在了前面。


一方面持续打磨 Mureka 基模能力,自 2024 年 2 月 1.0 版本问世以来,在近两年时间里历经近十次迭代,不断突破 AI 音乐的上限;另一方面重视模型即产品能力,降低 C 端创作者的使用门槛,易用性更强的同时对用户更友好。


此次会上,Mureka 宣布将推出 AI Studio,专门为专业创作者打造一个更完整、更可控的音乐创作环境,通过更深度的编辑、结构调整和创作管理功能,提升 AI 在专业创作流程中的参与度。当然,该 Studio 也考虑到了新创作者的需求,保留了简单易用的体验。


借助 Mureka Studio,昆仑天工想要重塑音乐创作范式,将创作者从操作技巧中解放出来,让创作回归到「想法」和「审美」本身。


这意味着,未来的创作者只需要像导演一样指挥全局,提出清晰的创意构想,然后将大量细粒度的执行工作交给 AI 来高效完成,包括情绪铺垫与推进、乐器演奏、主副歌衔接、人声混音等等。这种创作维度上的升级,可以构建出前所未有的听觉体验。


Mureka Studio 创作者内测正在火热进行中


同时在 B 端,Mureka 将继续巩固其作为「全球首批开放 API 服务、全球首个开放模型微调功能」的平台优势。


其中 Mureka API 在满足基本的音乐生成需求之外,通过完整的接口封装将深度创作的控制权交由终端用户,让他们可以结合歌词、人声和参考歌曲进行定制与调整。配合针对音乐创作和视频创作等全场景的模型微调服务以及未来全面开放的 AI Studio 能力,我们可以期待 Mureka 在更更多样化的商业场景与应用中发挥自己的价值。


此外,昆仑天工还宣布与太和音乐达成战略合作,为 AI 创作者提供流量扶持与变现机会。两者的强强联合将推动更多人参与到 AI 音乐创作的行列中来,还可能加速 AI 音乐进入商业化、正版化的落地阶段。


当 AI 音乐成为一种新的品类,Al 版「Spotify」会成为行业的灯塔。昆仑天工愿以一个先行者的姿态,为音乐产业的全新生态铺路。


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:liyazhou@jiqizhixin.com

AI音乐成为第五大品类,我持谨慎乐观态度。目前AI音乐的独特性主要在于其创作方式和效率,能够快速生成大量不同风格的作品。但要真正成为一个独立的品类,还需要在音乐内容本身有所突破。例如,AI是否能够创造出独特的音乐结构、和声体系或演奏技巧?是否能够表达人类难以表达的情感或思想?这些都是需要进一步探索的问题。不过,考虑到AI技术的快速发展,我相信未来AI音乐有很大的潜力。

楼上的问题很有意思!我觉得现在AI音乐在技术上已经很厉害了,但情感这东西,挺玄乎的。我听AI生成的音乐,有时候会觉得很精致,但总觉得少了点啥,可能是人类那种经历过生活后才能有的感悟吧。不过话说回来,有些口水歌也没啥感情啊,这么看AI还算可以了,期待AI能做出真正触动人心的音乐!

这个目标很有野心啊!我觉得要实现这个目标,AI音乐需要在独特性和艺术性上有所突破,不能只是模仿现有音乐风格。如果AI音乐真的成为一种新品类,那肯定会改变音乐的生产和消费方式,可能会出现更多个性化的定制音乐服务,也可能会有专门的AI音乐平台。但同时也要警惕版权问题和AI滥用,需要有完善的法律法规来规范。

楼上说的太绝对了吧。AI只是工具,关键看你怎么用。就像摄影一样,相机再好,也得会拍照的人才能拍出好作品。音乐也一样,AI再强,也得懂音乐的人才能用它创作出有灵魂的作品。真正有才华的音乐人,肯定能从AI的发展中找到新的机会。

其实我觉得这种合作模式,更像是一种“AI+传统”的融合。太和音乐可以利用AI来提高音乐制作的效率,而AI音乐则可以借助太和音乐的平台来实现商业价值。双方各取所需,共同推动音乐产业的发展。

同意楼上的观点!目前AI音乐确实在技术层面取得了很大的进步,但在情感表达上还稍显逊色。我觉得除了情感,版权问题也是一个很大的瓶颈。AI生成的音乐如果大量使用了现有的音乐素材,那么版权归属就变得非常复杂,这可能会阻碍AI音乐的进一步发展。

我觉得是机遇大于挑战。AI 可以成为音乐人的好帮手,帮助他们更高效地完成创作,甚至可以激发新的灵感。关键在于,音乐人要学会如何利用 AI,而不是被 AI 取代。

AI 音乐的价值在于其无限的可能性。它可以根据不同的场景和需求,定制化生成各种类型的音乐,满足个性化的需求。比如,根据用户的情绪状态,自动生成舒缓或激昂的音乐。

AI音乐要成为独立的品类,我觉得最大的挑战还是情感的独特性和创新性。现在AI做的更多是模仿和组合,缺少那种直击灵魂的原创力。得让AI真正理解情感,创造出与众不同的音乐语言才行。

我认为这种合作的关键在于版权保护和分成机制。AI创作的音乐,版权归谁?创作者、AI公司、还是太和音乐?分成比例怎么定?这些问题解决不好,商业化就很难持续。

谢邀,从学术角度看,AI音乐的普及需要解决技术、法律和伦理三个层面的问题。技术上,需要提升AI模型的创造性和情感表达能力;法律上,需要明确AI创作的版权归属和利益分配机制;伦理上,需要探讨AI音乐对人类音乐创作的冲击和影响。只有这三个问题都得到解决,AI音乐才能健康发展。

楼上说的有道理,但我觉得最关键的还是要有足够多的好作品。现在AI音乐听起来新鲜,但能让人单曲循环的太少了。等AI能创作出真正打动人心的作品,自然就能被大众接受了。另外,我觉得可以多尝试一些跨界合作,比如AI音乐+游戏、AI音乐+电影,这样更容易破圈。

个人觉得AI音乐未来会像摄影一样,一部分人追求极致的专业,用传统方式创作;另一部分人则会拥抱AI,用更便捷的方式表达自己。这两种方式会长期并存,并且相互影响。

与其说是新天地,不如说是工具的进化。想想以前的电子乐,不也是被各种质疑?现在还不是成了主流。AI音乐降低了创作门槛,让更多人参与进来,说不定会涌现出更多有意思的东西。当然,版权问题也是个大坑。

我更关注的是AI歌手背后的“人”。真人歌手有故事,有经历,唱出来的歌才更有感染力。AI 歌手是数据堆砌出来的,缺少了这种 human connection。 假如AI歌手的声音无限接近真人,我可能会想,这是谁在操控它?是谁赋予它情感?

个人感觉有潜力,现在AI生成音乐在编曲和制作上已经很厉害了,如果能解决版权问题,并且在互动性上做创新,比如让听众参与到AI音乐的创作中,说不定真能火起来。