MiniMax 新模型 Music 2.6 引领 AI 音乐创作新潮流:20 秒 Cover 全风格音乐

MiniMax发布Music 2.6模型,最快20秒cover全风格歌曲,并上线Music Skills,AI音乐创作进入零成本时代。

原文标题:刚刚,MiniMax新模型接管「音乐圈」!20秒出歌Cover全风格

原文作者:机器之心

冷月清谈:

MiniMax发布Music 2.6模型,核心功能为Cover翻唱,用户无需提供提示词,仅需提供参考歌曲,AI即可翻唱成指定风格。新模型在速度、音乐性和音质上均有提升,首包延迟压缩至20秒以内,乐器种类更丰富,音质优化中低频,贝斯和鼓点质感提升。同时,MiniMax还上线 Music Skills,包含minimax-music-gen(核心生成引擎)、minimax-music-playlist(个性化歌单生成器)和 buddy-sings(宠物歌曲生成器)。Music 2.6进入“可控创作”阶段,支持超100种乐器,乐器与人声配合更紧密,用户通过简单的风格提示词,即可快速生成包含歌词的完整歌曲。

怜星夜思:

1、MiniMax Music 2.6 模型的 Cover 翻唱功能,在保留旋律的基础上进行风格转换,你觉得这种技术在音乐创作领域有哪些潜在的应用场景?除了文中提到的鬼畜二创、品牌定制改编曲、节日特供版本,还能用在哪些方面?
2、文章中提到 Music 2.6 模型在乐器种类和音质上都有所提升,特别是中低频的优化。你认为这些改进对不同类型的音乐风格会产生什么影响?例如,对于古典音乐、电子音乐、摇滚乐等,哪种风格可能受益最大?为什么?
3、MiniMax 推出的 Music Skills 套件,特别是 minimax-music-playlist 歌单生成器,能根据用户的音乐品味画像生成定制歌单。你认为这种个性化推荐在音乐 App 中有多大的价值?它能否真正帮助用户发现更多符合自己口味的好音乐?或者会带来信息茧房效应?

原文内容

图片
编辑|杨文、Youli

音乐圈,正被 AI 搅得天翻地覆。


这两年 AI 音乐的进化速度,比大多数人预想得都快。


过去想做出一首像样的作品,要经历词、曲、编、录、混五道环节,周期起码半个月起,成本少则几千,多则数万。AI 出现后,输入一句提示词就能直出完整作品,创作成本一压再压。


而现在,我们甚至连提示词都不用研究了,找首喜欢的歌丢给 AI,它直接翻唱成我们想要的风格,毫无音乐基础的普通人,也能在几分钟内拿到一首属于自己的歌。


AI 音乐,正加速迈进一个零成本创作时代。


4 月 10 日,MiniMax 又带来一次重磅更新,其中最核心的新功能,就是 Cover 翻唱


一首平平无奇的生日快乐歌,可以被 cover 成 EDM 风格:



经典的《友谊地久天长》也能被 AI 改编成灵魂乐调调:



与此同时,MiniMax 还正式上线 Music 2.6 模型,并发布专属 Music Skills



相比上一版本,Music 2.6 的改进集中在三条线上:速度、音乐性和音质。首包延迟预计压缩到 20 秒以内;乐器种类更丰富,人声也往随性、自由的真实演唱状态靠拢;音质上则重点优化了中低频,贝斯和鼓点的下潜质感改善明显。


比如这首烟熏感的前卫爵士与新灵魂乐融合曲:



目前,Music 2.6 已开放体验,C 端用户可免费畅玩 14 天,每日有 500 首免费生成额度,API 也对所有用户开放 Music 2.6 和 Cover 的调用。



体验链接:https://www.minimaxi.com/audio/music


接下来,我们就奉上一手实测。


Cover 翻唱能力:旋律留下,风格换掉


Cover 翻唱是 AI 音乐领域一直被反复尝试、却也反复翻车的难题。


难点在于旋律要留,但所有包裹它的编曲语言、演唱风格、律动质感,要能做到真正的风格置换。


MiniMax 这个新功能可以在保持参考歌曲旋律特征基础上,自由进行伴奏改编、歌词替换、风格迁移


我们先测下歌词替换、旋律保留。这个需求在内容创作圈子很普遍,比如做鬼畜二创、品牌定制改编曲、节日特供版本等,核心诉求都是旋律不动换个歌词。


我们选了首网络神曲《哈基米》,把歌词换成职场打工人日常碎碎念。



新歌词的音节分布和字数密度与原旋律的吻合度相当高,不需要事后手动调整哪句词和旋律对不上的问题。对于没有乐理基础、但有改词需求的用户来说,这一步节省的时间和试错成本相当可观。



再听下昏暗的老式爵士酒吧里独饮、饱经沧桑沙哑男声的灵魂乐版。



我们又上传一首耳熟能详的江苏民歌《茉莉花》,要求改编成摇滚版本。


AI 翻唱中,编曲融入强烈的电吉他失真节奏与贝斯驱动,配合激烈的鼓组设计,前奏以现代摇滚元素切入,副歌人声高亢有力,爆发力与舞台氛围感均在线。



在一次节目上,安妮・海瑟薇即兴说唱 diss 狗仔。我们就让 MiniMax 把这首节奏密度很高的说唱改成校园民谣风格。



AI 模拟的人声蛮自然,吉他伴奏编排流畅,托得住人声,将充满侵略性的说唱词配上温柔的民谣曲调,有种一本正经唱怪词的幽默。



Music Skills:普通人随心「手搓」音乐


此次更新,MiniMax 还开放了三个 Music Skills 套件,托管在 GitHub 仓库,可通过 mmx-cli 丝滑调用。



音乐生成也正在快速走向 Agent 化,AI 能主动理解我们的需求、处理多步操作,大大突破了交互和工作流的局限,以前想不到的玩法,现在都变得容易实现了。


其中 minimax-music-gen 作为核心生成引擎,封装了人声、纯音乐和翻唱三种模式。我们可以通过简单的 Prompt 或 API 调用实现精准的强控制创作。


GitHub 链接:https://github.com/MiniMax-AI/skills/tree/main/skills/minimax-music-gen


如果觉得单曲不过瘾,还可以试下 minimax-music-playlist。这是个性化歌单生成器,能扫描本地音乐应用,如 Apple Music、QQ 音乐、Spotify 或网易云,构建我们的音乐品味画像,包括风格分布、语言偏好、情绪倾向等,并据此规划生成 3 到 7 首定制歌单。整个过程支持实时反馈评分,歌单越听越合心意。


比如说一句「帮我生成一个深夜放松的歌单」或「给我做个 3 首歌的通勤歌单」,Agent 便会自动扫描本地音源、规划歌单并播放。


GitHub 链接:https://github.com/MiniMax-AI/skills/tree/main/skills/minimax-music-playlist 


buddy-sings 则专为宠物爱好者打造。它会读取 Claude Code 宠物名字和个性,自动生成专属声音身份,以宠物第一人称视角创作并演唱歌曲,还能根据当前会话上下文来个即兴创作。


GitHub 链接:https://github.com/MiniMax-AI/skills/tree/main/skills/buddy-sings


只要在环境变量中配置好 API Key,通过简单的命令行切换中英双语,一个本地 AI 音乐工作室就搞定了。


Music 2.6 模型:听听它到底进步在哪


与上一版本相比,Music 2.6 已经进入「可控创作」阶段,不管是控制性、实时性,还是创作自由度上,都有全方位突破。


简单来说,就是更丰富自然、律动感更强、创作更便捷。


音乐性上最直观的变化,是乐器种类的扩充,支持超 100 种乐器,乐器与人声的配合也更紧密、和谐。



音质上,Music 2.6 提升的不只是声音变清晰,中低频优化后带来的律动感更强,非常适合节奏感强的流行、电子或摇滚乐。


例如用「节奏感强的流行、摇滚乐」这几个字作为提示词,就能跑出一首完整的歌曲。



Music 2.6 对非专业创作者最友好的一点,是沟通成本大幅降低,即便不输入歌词,只给出风格提示词,最快 20s 内即可生成一首包含歌词的完整曲目。


纯器乐提示词:「爵士小酒馆,钢琴三重奏,有点慵懒。」



我们还尝试了「古词新唱」,将《水调歌头》的词直接作为歌词,分别搭配不用风格提示词,短时间内就得到风格迥异的 demo。


提示词:「古风,古典、琵琶、古琴。」



提示词:「民谣、原声吉他、忧郁。」



总而言之,Music 2.6 在情绪掌控、BPM(速度)与 Key(调性)锁定上,已经实现以用户意图为导向,不再像之前那样「开盲盒」随机输出。


现在只要给出明确的情感基调与节奏指令,它就能交出契合需求且富有感染力的作品。


结语


AI 音乐和真人音乐,最终的区别在哪里?


技术层面的差距在快速收窄,这是无法回避的事实。Music 2.6 在延迟、控制精度和音乐性上的进步,都是可感知的,不是「挤牙膏式」的小修小补。


Cover 能力的加入,更是把 AI 音乐推向「二次创作」的维度,这个维度历来是人类音乐人最活跃的领域之一。


创作的门槛在变低。有旋律想法但不会编曲、想做播客但请不起音乐人、想给自家宠物写一首搞笑歌…… 以前这些念头只能留在脑子里,现在不用了。


技术永远是工具,工具足够好用的时候,它真正解放的,是那些一直有想法、只是缺少出口的人。


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:liyazhou@jiqizhixin.com

除了情感,我觉得 AI 音乐的创新性也需要加强。现在很多 AI 音乐听起来都比较套路化,缺乏惊喜。希望未来的 AI 能够突破现有的音乐框架,创造出前所未有的音乐风格。

同意楼上的看法,版权问题必须重视!我觉得除了旋律,AI训练模型的数据来源也很关键。如果训练数据本身就包含大量未授权的音乐作品,那生成的内容可能天然就带有侵权风险。所以,平台方需要确保 AI 使用的素材是合法授权的,否则容易惹上官司。

编曲的精细度也很重要!现在很多 AI 编曲听起来还是有点生硬,乐器之间的配合不够自然。如果 AI 能够学习 Master 级别编曲师的技巧,那 AI 音乐的质量肯定会更上一层楼。

冲击肯定是有的,以后人人都是音乐人,那专业的音乐人怎么办?但是我觉得更多的是机遇。AI 可以成为音乐人的好帮手,帮助他们快速完成一些重复性的工作,比如编曲、配乐等等,让他们有更多的时间和精力去进行更具创造性的工作。

有没有一种可能,AI cover出来的作品,既保留了原曲的旋律特征,又进行了足够的创新,那版权归属应该怎么算?这估计会成为未来音乐版权领域的一个新课题。也许可以考虑建立一个AI音乐版权登记制度,明确各方的权益和责任。

这个问题问得好!AI Cover 功能确实很方便,但版权问题是个大坑。主要风险可能在于未经授权使用原曲旋律进行风格改编,这在法律上可能被认定为侵权。特别是用于商业用途时,风险更高。我们需要思考的是,在技术进步的同时,如何建立一套完善的版权保护机制,平衡创新与尊重原创。

个性化推荐绝对是音乐 App 的未来!现在信息爆炸,好音乐太多了,靠用户自己去筛选简直是大海捞针。个性化推荐能根据你的听歌习惯,精准地推送你可能喜欢的音乐,大大提高了发现好音乐的效率。我现在的歌单里,很多都是靠算法推荐发现的宝藏歌曲。

从更广阔的角度来看,这个技术可能推动音乐版权管理的变革。如果 AI 能够高效地生成各种风格的 Cover,那么如何界定版权归属、如何进行收益分配,这些都需要重新思考。也许未来会出现一种全新的音乐版权模式。

摇滚乐的话,我觉得低音的下潜能够让摇滚更有力量,特别是重型摇滚,但是感觉摇滚乐更重要的是现场的感染力,AI这方面还是差点意思。