词元之母TOK.MOM - 平台充值汇率 1:1 即 1 人民币充值到账 1 美元,支持一个 Key 调用近 600+ 海内外模型,限时特价模型低至 1 折,欢迎上岸!
| 来源 | 内置(默认安装) |
| 路径 | skills/media/heartmula |
| 版本 | 1.0.0 |
| 平台 | linux, macos, windows |
| 标签 | music, audio, generation, ai, heartmula, heartcodec, lyrics, songs |
| 相关 skill | audiocraft |
--lazy_load true(按需加载/卸载模型)--mula_device cuda:0 --codec_device cuda:1 将模型分布到多张 GPUsrc/heartlib/heartmula/modeling_heartmula.py:HeartMuLa 类的 setup_caches 方法中,在 reset_caches 的 try/except 块之后、with device: 块之前,添加 RoPE 重新初始化代码:from_pretrained 首先在 meta 设备上创建模型;Llama3ScaledRoPE.rope_init() 在 meta 张量上跳过缓存构建,且在权重加载到真实设备后也不会重建。src/heartlib/pipelines/music_generation.py:HeartCodec.from_pretrained() 调用中添加 ignore_mismatched_sizes=True(共 2 处:__init__ 中的 eager 加载和 codec 属性中的 lazy 加载)。initted buffer 在 checkpoint 中形状为 [1],而模型中为 []。数据相同,仅为标量与 0 维张量的差异,可安全忽略。--mula_device cuda --codec_device cuda)。如果用户已安装支持 CUDA 的 PyTorch 并拥有 NVIDIA GPU,则无需额外配置。torch==2.4.1 开箱即支持 CUDA 12.1torchtune 可能显示版本为 0.4.0+cpu — 这只是包元数据,实际仍通过 PyTorch 使用 CUDA--mula_device cpu --codec_device cpu 在 CPU 上运行,但生成速度会极慢(单首歌曲可能需要 30-60 分钟以上,而 GPU 约需 4 分钟)。CPU 模式还需要大量内存(12GB+ 空闲)。如果用户没有 NVIDIA GPU,建议使用云 GPU 服务(Google Colab 免费 T4、Lambda Labs 等)或访问在线 demo:https://heartmula.github.io/piano,happy,wedding,synthesizer,romanticrock,energetic,guitar,drums,male-vocal[Intro]
[Verse]
Your lyrics here...
[Chorus]
Chorus lyrics...
[Bridge]
Bridge lyrics...
[Outro]| 参数 | 默认值 | 说明 |
|---|---|---|
--max_audio_length_ms | 240000 | 最大时长(毫秒,240s = 4 分钟) |
--topk | 50 | Top-k 采样 |
--temperature | 1.0 | 采样温度(temperature) |
--cfg_scale | 1.5 | 无分类器引导(classifier-free guidance)缩放比例 |
--lazy_load | false | 按需加载/卸载模型(节省显存) |
--mula_dtype | bfloat16 | HeartMuLa 的数据类型(推荐 bf16) |
--codec_dtype | float32 | HeartCodec 的数据类型(推荐 fp32 以保证质量) |