阿里开源 CosyVoice 语音克隆部署和使用

应该是 开源界音色最稳定 的语音合成和克隆模型了，支持预训练音色合成、自然语言控制、3秒极速复刻和跨语种复刻。

官方部署方式比较复杂，错误较多，我这里进行了整理和优化，支持GPU和CPU，方便大家使用。

CosyVoice 开源仓库: CosyVoice

效果展示

均支持 GPU 和 CPU
第一次启动过程可能会有点长，需要从魔搭下载3个模型

注意：文件夹中不能有中文、特殊字符和空格，否则可能会启动失败

确保已经安装了Docker软件，没有的话，从官网下载安装 https://www.docker.com/products/docker-desktop/

复制以下代码到终端运行即可

1
2

curl -fsSL https://harryai.cc/cosyvoice/docker-compose.yml -o docker-compose.yml
docker-compose up

1
2

curl -fsSL https://harryai.cc/cosyvoice/docker-compose-gpu.yml -o docker-compose.yml
docker-compose up

docker 启动后，访问 http://127.0.0.1:50000/