Ii-robot!7191 add_audio_comfyui

2cd2c4cc创建于 2025年4月20日历史提交

文件	最后提交记录	最后更新时间
stableaudio	!7191 add_audio_comfyui Merge pull request !7191 from zhoufan2956/add_audio_comfyui4	1 年前
README.md	!7191 add_audio_comfyui Merge pull request !7191 from zhoufan2956/add_audio_comfyui4	1 年前
__init__.py	!7191 add_audio_comfyui Merge pull request !7191 from zhoufan2956/add_audio_comfyui4	1 年前
nodes.py	!7191 add_audio_comfyui Merge pull request !7191 from zhoufan2956/add_audio_comfyui4	1 年前
requirements.txt	!7191 add_audio_comfyui Merge pull request !7191 from zhoufan2956/add_audio_comfyui4	1 年前
workflow.json	!7191 add_audio_comfyui Merge pull request !7191 from zhoufan2956/add_audio_comfyui4	1 年前

Stable-Audio-Open-1.0 ComfyUI推理指导

一、准备运行环境

表 1 版本配套表

配套	版本	环境准备指导
Python	3.10.2	-
torch	2.1.0	-

1.1 获取CANN&MindIE安装包&环境准备

设备支持 Atlas 800I A2推理设备：支持的卡数为1
Atlas 800I A2
环境准备指导

1.2 CANN安装

# 增加软件包可执行权限，{version}表示软件版本号，{arch}表示CPU架构，{soc}表示昇腾AI处理器的版本。
chmod +x ./Ascend-cann-toolkit_{version}_linux-{arch}.run
chmod +x ./Ascend-cann-kernels-{soc}_{version}_linux.run
# 校验软件包安装文件的一致性和完整性
./Ascend-cann-toolkit_{version}_linux-{arch}.run --check
./Ascend-cann-kernels-{soc}_{version}_linux.run --check
# 安装
./Ascend-cann-toolkit_{version}_linux-{arch}.run --install
./Ascend-cann-kernels-{soc}_{version}_linux.run --install

# 设置环境变量
source /usr/local/Ascend/ascend-toolkit/set_env.sh

1.3 MindIE安装

# 增加软件包可执行权限，{version}表示软件版本号，{arch}表示CPU架构。
chmod +x ./Ascend-mindie_${version}_linux-${arch}.run
./Ascend-mindie_${version}_linux-${arch}.run --check

# 方式一：默认路径安装
./Ascend-mindie_${version}_linux-${arch}.run --install
# 设置环境变量
cd /usr/local/Ascend/mindie && source set_env.sh

# 方式二：指定路径安装
./Ascend-mindie_${version}_linux-${arch}.run --install-path=${AieInstallPath}
# 设置环境变量
cd ${AieInstallPath}/mindie && source set_env.sh

1.4 Torch_npu安装

安装pytorch框架版本2.1.0 安装包下载

使用pip安装

# {version}表示软件版本号，{arch}表示CPU架构。
pip install torch-${version}-cp310-cp310-linux_${arch}.whl

下载 pytorch_v{pytorchversion}_py{pythonversion}.tar.gz

tar -xzvf pytorch_v{pytorchversion}_py{pythonversion}.tar.gz
# 解压后，会有whl包
pip install torch_npu-{pytorchversion}.xxxx.{arch}.whl

二、下载ComfyUI

ComfyUI是一个基于节点的stable diffusion用户界面，用户能够通过链接不同的节点来构建复杂的图像生成工作流程，图像生成速度上超越传统WebUI，而且显存占用更少。

2.1 下载ComfyUI官方代码仓，并安装相关依赖

git clone https://github.com/comfyanonymous/ComfyUI

2.2 下载相关依赖

cd ComfyUI
pip install -r requirements.txt

三、加载MindIE SD 加速插件

3.1 下载插件并导入ComfyUI

git clone https://modelers.cn/MindIE/stable_audio_open_1.0.git
cp -r stable_audio_open_1.0/StableAudio_Comfyui_Plugin /PATH/TO/ComfyUI/custom_nodes/

注：/PATH/TO/ComfyUI为ComfyUI下载路径

3.2 依赖安装

cd /PATH/TO/ComfyUI/custom_nodes/StableAudio_Comfyui_Plugin/
pip3 install -r requirements.txt
apt-get update
apt-get install libsndfile1

3.3 权重下载

下载text_encoder权重，保存为t5_base.safetensors，并将其放在 ComfyUI/models/text_encoders/路径下

https://huggingface.co/google-t5/t5-base/blob/main/model.safetensors

下载diffusion_model权重，保存为stable_audio_open_1.0.safetensors，并将其放在ComfyUI/models/checkpoints/路径下

https://huggingface.co/stabilityai/stable-audio-open-1.0/tree/main ，

下载transformers权重，新建文件夹ComfyUI/models/mindiesd/stable-audio-open-1.0/transformer，并保存在该路径下(包含config.json)

https://huggingface.co/stabilityai/stable-audio-open-1.0/tree/main/transformer

四、启动ComfyUI

4.1 执行ComfyUI启动脚本

python main.py --gpu-only --listen

参数说明：

--gpu-only：只在device（gpu/npu）上执行推理
--listen：服务器监听的的ip地址，默认0.0.0.0

执行成功后会显示

To seethe GUI go to: http://0.0.0.0:8188
To seethe GUI go to: http://[::]:8188

打开本地计算机的代理设置，对当前服务器IP设置为不进行代理。本地浏览器访问 http://xx.xx.xx.xx:8188，xx.xx.xx.xx为容器所在服务器IP，即可访问容器内开启的ComfyUI服务。

4.2 加载工作流

代码仓中提供stable_audio_open_1.0的加速工作流，路径为stable_audio_open_1.0/StableAudio_Comfyui_Plugin/workflow.json，在ComfyUI页面加载该工作流，即可执行推理。亦可下载ComfyUI官方提供的StableAudio工作流，在ComfyUI页面加载后，右键添加节点，选择MindIE SD/StableAudio类别下的加速节点，手动替换官方工作流中模型。

https://comfyanonymous.github.io/ComfyUI_examples/audio/stable_audio_example.flac

4.3 执行推理

在UI界面点击运行，完成推理。