简介

GitHub项目 jianchang512/clone-voice 是一个声音克隆工具，提供了一个带有Web界面的应用程序，可以使用你的音色或任意声音来录制音频并进行声音克隆。这个工具使用了coqui.ai开源的xtts_v2模型，并遵循Coqui Public Model License 1.0.0开源协议。它支持多种语言，并且非常简单易用，即使没有N卡GPU也可以使用。

使用教程

准备工作

首先，我们需要下载声音克隆工具的预编译版本和模型文件。你可以在项目的Releases页面下载预编译版主文件和模型文件，并将它们解压到你的电脑上的某个目录中，比如”E:/clone-voice”。

https://github.com/jianchang512/clone-voice/releases

打开应用程序

双击预编译版主文件中的app.exe，等待应用程序自动打开Web窗口。请注意，如果出现任何错误，错误信息将显示在命令提示符窗口中，请仔细阅读并处理错误信息。

录制音频

在打开的Web界面中，你可以选择两种操作：文字到声音和声音到声音。如果你选择文字到声音，你可以在文本框中输入要合成的文字或者导入srt字幕文件，然后点击”立即开始”按钮。如果你选择声音到声音，你可以点击或拖拽要转换的音频文件（支持mp3/wav/flac格式），然后从下拉框中选择要克隆的音色。如果没有满意的音色可选，你可以点击”本地上传”按钮，选择已录制好的5-20秒的wav/mp3/flac声音文件，或者点击”开始录制”按钮，在线录制你自己的声音（5-20秒），录制完成后点击”使用”按钮。接着，点击”立即开始”按钮进行声音克隆。