Parrot - 高效语音克隆生成工具:专业级性能,精准语音合成

Parrot是一款强大的语音生成工具,支持多种模式以满足不同的需求。无论是快速推理、语言控制还是精准模式,Parrot都能提供高质量的语音合成效果。通过简单的参数设置,您可以轻松地将文本转换为自然流畅的语音,并且支持自定义说话人和语言控制。适用于Windows、Linux和macOS系统,Parrot是您日常办公和开发的理想选择。
独特吧-Parrot - 高效语音克隆生成工具:专业级性能,精准语音合成

主要特性

  • 多模式支持:快速推理、语言控制和精准模式,适应各种应用场景。
  • 自定义说话人:选择默认说话人或自定义您的专属声音。
  • 精准语音合成:在精准模式下,提供高质量的语音输出,需提供音频的实际文本内容。
  • 跨平台支持:支持Windows、Linux和macOS系统,轻松部署和运行。

使用说明:在Windows系统上运行Parrot

1. 下载并解压模型

首先,从提供的链接下载适用于Windows系统的模型文件,并将其解压缩到一个方便访问的目录中。

2. 配置环境

为了确保您的开发环境配置正确,请按照以下步骤操作:

安装Miniconda(或其他环境管理工具)

如果您尚未安装Miniconda,请先进行安装。

创建并激活conda环境

打开命令提示符(cmd),然后输入以下命令来创建并激活一个新的conda环境:

conda create -n Parrot -y python=3.10
conda activate Parrot

安装项目依赖项

接下来,安装项目所需的依赖项:

pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple/

3. 运行Parrot

完成上述步骤后,您可以开始运行Parrot。请确保当前工作目录是在您解压模型文件的路径下。

在桌面环境中运行

flet run

在浏览器中运行

如果您希望在浏览器中运行,请使用以下命令:

flet run -w --host 127.0.0.1 -p 8000

4. 使用Python脚本启动API服务

如果您需要单独在平台上运行模型API(即模型分离场景),请按照以下步骤操作:

  • 切换到模型所在的路径。
  • 在命令提示符中执行以下命令以启动API服务:
python.exe fastapi_app.py

请注意,由于接口未做鉴权,请仅在受信任的网络环境下使用此服务。

参数说明

  • 文本内容:需要朗读的内容。
  • 说话人:选择默认说话人(角色)或自定义说话人。
  • 提示音频:一段清晰的人声音频文件或可访问的文件URL。
  • 提示词(语言控制):用于控制朗读该段文字的语言,例如:“请使用四川话朗读”。
  • 参考音频文本内容(精准模式):提示音频的实际内容。例如,如果音频内容是“你好,欢迎使用Parrot”,这里就应该填写“你好,欢迎使用Parrot”。

模式区别

  • 快速推理:直接使用音频进行语音生成,效果较差。
  • 语言控制:效果与快速推理类似,但支持通过提示词更改实际生成的语言。
  • 精准模式:效果很好,但需要提供提示音频的实际文本内容。
下载地址
夸克网盘