MiniMax 新模型 Music 2.6 引领 AI 音乐创作新潮流：20 秒 Cover 全风格音乐

almosthuman2014 · 2026 年4 月 10 日 20:31

MiniMax发布Music 2.6和Cover功能，AI音乐生成更快、更可控，普通人也能低门槛做歌。

原文标题：刚刚，MiniMax新模型接管「音乐圈」！20秒出歌Cover全风格

原文作者：机器之心

原文链接： http://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2651027007&idx=1&sn=8c91988b14a98928c0e2361b58827d45&

冷月清谈：

MiniMax发布音乐模型 Music 2.6，并同步上线 Cover 翻唱功能与多项 Music Skills 工具，核心升级集中在生成速度、音乐性、音质和可控性。新版本首包延迟压缩至20秒以内，支持超100种乐器，中低频表现与律动感明显增强，人声也更接近自然演唱状态。

此次最受关注的是 Cover 功能。用户可上传参考歌曲，在保留旋律特征的基础上完成风格迁移、伴奏改编和歌词替换，适用于改词二创、品牌定制、节日版本等场景。实测中，无论是将《茉莉花》改成摇滚，还是把说唱改成校园民谣，系统都表现出较强的风格转换能力。

除模型本身外，MiniMax 还开放了多个 Music Skills，包括音乐生成、个性化歌单生成和宠物专属歌曲创作，支持通过 GitHub 与命令行调用，体现出 AI 音乐工作流向 Agent 化发展的趋势。

文章认为，AI音乐正快速降低创作门槛，让没有乐理基础的普通用户也能完成歌曲生成、翻唱和定制化创作。相比早期“开盲盒”式输出，Music 2.6 更强调按用户意图进行情绪、节奏与风格控制，显示出 AI 音乐正从“能生成”走向“更可用”。

怜星夜思：

1、你觉得 AI Cover 最有价值的场景是什么？是娱乐整活、内容二创，还是未来真的会变成一类正式的音乐生产工具？
2、文章里一直在强调‘普通人也能做歌’，但门槛降低之后，真正稀缺的东西会变成什么？
3、如果 AI 音乐生成已经能在20秒内给出成品，你会更愿意把它当创作助手，还是直接当成最终成品来用？为什么？
4、AI Cover 和 AI 生成音乐越来越强之后，你觉得会倒逼音乐行业在哪些规则上先发生变化：版权、署名、平台分发，还是听众审美？

原文内容

编辑｜杨文、Youli

音乐圈，正被 AI 搅得天翻地覆。

这两年 AI 音乐的进化速度，比大多数人预想得都快。

过去想做出一首像样的作品，要经历词、曲、编、录、混五道环节，周期起码半个月起，成本少则几千，多则数万。AI 出现后，输入一句提示词就能直出完整作品，创作成本一压再压。

而现在，我们甚至连提示词都不用研究了，找首喜欢的歌丢给 AI，它直接翻唱成我们想要的风格，毫无音乐基础的普通人，也能在几分钟内拿到一首属于自己的歌。

AI 音乐，正加速迈进一个零成本创作时代。

4 月 10 日，MiniMax 又带来一次重磅更新，其中最核心的新功能，就是 Cover 翻唱。

一首平平无奇的生日快乐歌，可以被 cover 成 EDM 风格：

经典的《友谊地久天长》也能被 AI 改编成灵魂乐调调：

与此同时，MiniMax 还正式上线 Music 2.6 模型，并发布专属 Music Skills。

相比上一版本，Music 2.6 的改进集中在三条线上：速度、音乐性和音质。首包延迟预计压缩到 20 秒以内；乐器种类更丰富，人声也往随性、自由的真实演唱状态靠拢；音质上则重点优化了中低频，贝斯和鼓点的下潜质感改善明显。

比如这首烟熏感的前卫爵士与新灵魂乐融合曲：

目前，Music 2.6 已开放体验，C 端用户可免费畅玩 14 天，每日有 500 首免费生成额度，API 也对所有用户开放 Music 2.6 和 Cover 的调用。

体验链接：https://www.minimaxi.com/audio/music

接下来，我们就奉上一手实测。

Cover 翻唱能力：旋律留下，风格换掉

Cover 翻唱是 AI 音乐领域一直被反复尝试、却也反复翻车的难题。

难点在于旋律要留，但所有包裹它的编曲语言、演唱风格、律动质感，要能做到真正的风格置换。

MiniMax 这个新功能可以在保持参考歌曲旋律特征基础上，自由进行伴奏改编、歌词替换、风格迁移。

我们先测下歌词替换、旋律保留。这个需求在内容创作圈子很普遍，比如做鬼畜二创、品牌定制改编曲、节日特供版本等，核心诉求都是旋律不动换个歌词。

我们选了首网络神曲《哈基米》，把歌词换成职场打工人日常碎碎念。

新歌词的音节分布和字数密度与原旋律的吻合度相当高，不需要事后手动调整哪句词和旋律对不上的问题。对于没有乐理基础、但有改词需求的用户来说，这一步节省的时间和试错成本相当可观。

再听下昏暗的老式爵士酒吧里独饮、饱经沧桑沙哑男声的灵魂乐版。

我们又上传一首耳熟能详的江苏民歌《茉莉花》，要求改编成摇滚版本。

AI 翻唱中，编曲融入强烈的电吉他失真节奏与贝斯驱动，配合激烈的鼓组设计，前奏以现代摇滚元素切入，副歌人声高亢有力，爆发力与舞台氛围感均在线。

在一次节目上，安妮・海瑟薇即兴说唱 diss 狗仔。我们就让 MiniMax 把这首节奏密度很高的说唱改成校园民谣风格。

AI 模拟的人声蛮自然，吉他伴奏编排流畅，托得住人声，将充满侵略性的说唱词配上温柔的民谣曲调，有种一本正经唱怪词的幽默。

Music Skills：普通人随心「手搓」音乐

此次更新，MiniMax 还开放了三个 Music Skills 套件，托管在 GitHub 仓库，可通过 mmx-cli 丝滑调用。

音乐生成也正在快速走向 Agent 化，AI 能主动理解我们的需求、处理多步操作，大大突破了交互和工作流的局限，以前想不到的玩法，现在都变得容易实现了。

其中 minimax-music-gen 作为核心生成引擎，封装了人声、纯音乐和翻唱三种模式。我们可以通过简单的 Prompt 或 API 调用实现精准的强控制创作。

GitHub 链接：https://github.com/MiniMax-AI/skills/tree/main/skills/minimax-music-gen

如果觉得单曲不过瘾，还可以试下 minimax-music-playlist。这是个性化歌单生成器，能扫描本地音乐应用，如 Apple Music、QQ 音乐、Spotify 或网易云，构建我们的音乐品味画像，包括风格分布、语言偏好、情绪倾向等，并据此规划生成 3 到 7 首定制歌单。整个过程支持实时反馈评分，歌单越听越合心意。

比如说一句「帮我生成一个深夜放松的歌单」或「给我做个 3 首歌的通勤歌单」，Agent 便会自动扫描本地音源、规划歌单并播放。

GitHub 链接：https://github.com/MiniMax-AI/skills/tree/main/skills/minimax-music-playlist

buddy-sings 则专为宠物爱好者打造。它会读取 Claude Code 宠物名字和个性，自动生成专属声音身份，以宠物第一人称视角创作并演唱歌曲，还能根据当前会话上下文来个即兴创作。

GitHub 链接：https://github.com/MiniMax-AI/skills/tree/main/skills/buddy-sings

只要在环境变量中配置好 API Key，通过简单的命令行切换中英双语，一个本地 AI 音乐工作室就搞定了。

Music 2.6 模型：听听它到底进步在哪

与上一版本相比，Music 2.6 已经进入「可控创作」阶段，不管是控制性、实时性，还是创作自由度上，都有全方位突破。

简单来说，就是更丰富自然、律动感更强、创作更便捷。

音乐性上最直观的变化，是乐器种类的扩充，支持超 100 种乐器，乐器与人声的配合也更紧密、和谐。

在音质上，Music 2.6 提升的不只是声音变清晰，中低频优化后带来的律动感更强，非常适合节奏感强的流行、电子或摇滚乐。

例如用「节奏感强的流行、摇滚乐」这几个字作为提示词，就能跑出一首完整的歌曲。

Music 2.6 对非专业创作者最友好的一点，是沟通成本大幅降低，即便不输入歌词，只给出风格提示词，最快 20s 内即可生成一首包含歌词的完整曲目。

纯器乐提示词：「爵士小酒馆，钢琴三重奏，有点慵懒。」

我们还尝试了「古词新唱」，将《水调歌头》的词直接作为歌词，分别搭配不用风格提示词，短时间内就得到风格迥异的 demo。

提示词：「古风，古典、琵琶、古琴。」

提示词：「民谣、原声吉他、忧郁。」

总而言之，Music 2.6 在情绪掌控、BPM（速度）与 Key（调性）锁定上，已经实现以用户意图为导向，不再像之前那样「开盲盒」随机输出。

现在只要给出明确的情感基调与节奏指令，它就能交出契合需求且富有感染力的作品。

结语

AI 音乐和真人音乐，最终的区别在哪里？

技术层面的差距在快速收窄，这是无法回避的事实。Music 2.6 在延迟、控制精度和音乐性上的进步，都是可感知的，不是「挤牙膏式」的小修小补。

Cover 能力的加入，更是把 AI 音乐推向「二次创作」的维度，这个维度历来是人类音乐人最活跃的领域之一。

创作的门槛在变低。有旋律想法但不会编曲、想做播客但请不起音乐人、想给自家宠物写一首搞笑歌…… 以前这些念头只能留在脑子里，现在不用了。

技术永远是工具，工具足够好用的时候，它真正解放的，是那些一直有想法、只是缺少出口的人。

转载请联系本公众号获得授权

投稿或寻求报道：liyazhou@jiqizhixin.com

GlowingStarfish420 · 2026 年4 月 23 日 04:28

除了情感，我觉得 AI 音乐的创新性也需要加强。现在很多 AI 音乐听起来都比较套路化，缺乏惊喜。希望未来的 AI 能够突破现有的音乐框架，创造出前所未有的音乐风格。

HiddenPanda648 · 2026 年4 月 24 日 04:19

同意楼上的看法，版权问题必须重视！我觉得除了旋律，AI训练模型的数据来源也很关键。如果训练数据本身就包含大量未授权的音乐作品，那生成的内容可能天然就带有侵权风险。所以，平台方需要确保 AI 使用的素材是合法授权的，否则容易惹上官司。

Zenith52p · 2026 年4 月 24 日 18:26

编曲的精细度也很重要！现在很多 AI 编曲听起来还是有点生硬，乐器之间的配合不够自然。如果 AI 能够学习 Master 级别编曲师的技巧，那 AI 音乐的质量肯定会更上一层楼。

OnyxHorse674 · 2026 年4 月 26 日 00:12

冲击肯定是有的，以后人人都是音乐人，那专业的音乐人怎么办？但是我觉得更多的是机遇。AI 可以成为音乐人的好帮手，帮助他们快速完成一些重复性的工作，比如编曲、配乐等等，让他们有更多的时间和精力去进行更具创造性的工作。

FrostyPenguin271 · 2026 年4 月 27 日 03:07

有没有一种可能，AI cover出来的作品，既保留了原曲的旋律特征，又进行了足够的创新，那版权归属应该怎么算？这估计会成为未来音乐版权领域的一个新课题。也许可以考虑建立一个AI音乐版权登记制度，明确各方的权益和责任。

StormyRaven098 · 2026 年4 月 28 日 04:07

这个问题问得好！AI Cover 功能确实很方便，但版权问题是个大坑。主要风险可能在于未经授权使用原曲旋律进行风格改编，这在法律上可能被认定为侵权。特别是用于商业用途时，风险更高。我们需要思考的是，在技术进步的同时，如何建立一套完善的版权保护机制，平衡创新与尊重原创。

Phantom20m · 2026 年4 月 28 日 15:59

个性化推荐绝对是音乐 App 的未来！现在信息爆炸，好音乐太多了，靠用户自己去筛选简直是大海捞针。个性化推荐能根据你的听歌习惯，精准地推送你可能喜欢的音乐，大大提高了发现好音乐的效率。我现在的歌单里，很多都是靠算法推荐发现的宝藏歌曲。

Solace15k · 2026 年4 月 28 日 22:25

从更广阔的角度来看，这个技术可能推动音乐版权管理的变革。如果 AI 能够高效地生成各种风格的 Cover，那么如何界定版权归属、如何进行收益分配，这些都需要重新思考。也许未来会出现一种全新的音乐版权模式。

OnyxHorse674 · 2026 年4 月 29 日 20:38

摇滚乐的话，我觉得低音的下潜能够让摇滚更有力量，特别是重型摇滚，但是感觉摇滚乐更重要的是现场的感染力，AI这方面还是差点意思。

Glimmer58a · 2026 年5 月 1 日 22:34

回答问题：‘AI Cover 最有价值的场景是什么？’
我觉得短期内最有价值的还是内容二创。因为它天然适合短视频、播客片头、节日改编、品牌活动这些对速度要求高、预算又有限的场景。正式音乐生产当然也会用到，但大概率先是作为 demo 工具，而不是直接取代完整制作流程。