GPT-SoVITS API Basic Reference

Iris_cat

公告

该站点仍在施工中！

Learn More

标签

AI Blogging Customization Demo Encryption Example Markdown Mermaid Mizuki Record Test Video 教程

Iris_cat

公告

该站点仍在施工中！

Learn More

标签

AI Blogging Customization Demo Encryption Example Markdown Mermaid Mizuki Record Test Video 教程

Iris_cat

公告

该站点仍在施工中！

Learn More

标签

AI Blogging Customization Demo Encryption Example Markdown Mermaid Mizuki Record Test Video 教程

站点统计

文章

9

分类

6

标签

13

总字数

3,574

运行天数

0 天

最后活动

0 天前

670 字

2 分钟

GPT-SoVITS API Basic Reference

2026-04-18

参考

AI

/

教程

写在前面#

本参考文档面向纯新手，内容有限，各位大佬请移步其它教程。

以防你不知道，其实GPT-SoVITS提供了API接口供其它程序调用。具体而言，就是根目录下的api.py。
什么？你说GPT-SoVITS是啥？它是一个低成本音色克隆软件，具体可以看花儿不哭大佬的这期视频。软件下载
我们只需用/runtime/python.exe启动api.py即可启动API。为了方便，可以仿照go-webui.bat写出go-api.bat。

1
set "SCRIPT_DIR=%~dp0"
2
set "SCRIPT_DIR=%SCRIPT_DIR:~0,-1%"
3
cd /d "%SCRIPT_DIR%"
4
set "PATH=%SCRIPT_DIR%\runtime;%PATH%"
5
runtime\python.exe -I api.py
6
pause

出现提示INFO running on http://0.0.0.0:9880 代表API服务已经启动了。第一次启动需要安装vc运行库。
GPT-SoVITS的API通过HTTP传输数据，只需要向 http://127.0.0.1:9880 发送请求即可。

API用法#

官方教程和工具
确保API启动后，访问http://127.0.0.1:9880/docs 即可获得API用法（英文）和链接构造测试一条龙服务，可以作为参考和测试工具。
设置模型
想必各位应该是训练了模型再来找API用法的吧。假如你没有训练模型，可以忽略此步（让GPT-SoVITS直接推模型，效果较差），或移步文章开头的这期视频。
用法如下：

1
http://127.0.0.1:9880/set_model?gpt_model_path={GPT_dir}&sovits_model_path={SOVITS_dir}

向这个地址发送GET请求，将{GPT_dir}和{SOVITS_dir}换成你的GPT模型（* .ckpt）和SoVITS模型（* .pth）的绝对路径（不建议用反斜杠，不建议带中文）（模型文件默认保存在/GPT_weights_模型版本/ 和 /SoVITS_weights_模型版本/）。如果成功，会返回：

1
Status Code: 200
2
Response: {"code":0,"message":"Success"}

示例代码：（使用了model_config.ini）
model_config.ini：

1
[DEFAULT]
2
GPT_dir=D:/ABS/PATH/TO/FILE.ckpt
3
SOVITS_dir=D:/ABS/PATH/TO/FILE.pth

需要安装Requests库

1
pip install requests

Python：

1
import configparser
2
import requests
3

4
def main():
5
    # 创建配置文件解析器
6
    config = configparser.ConfigParser()
7

8
    # 读取同目录下的 model_config.ini 文件
9
    config.read('model_config.ini')
10

11
    # 获取 GPT_dir 和 SOVITS_dir 字段的值
12
    GPT_dir = config.get('DEFAULT', 'GPT_dir')
13
    SOVITS_dir = config.get('DEFAULT', 'SOVITS_dir')
14

15
    # 构造请求 URL
16
    url = f"http://127.0.0.1:9880/set_model?gpt_model_path={GPT_dir}&sovits_model_path={SOVITS_dir}"
17
    print(url)
18
    # 发送 HTTP GET 请求
19
    response = requests.get(url)
20

21
    # 输出响应状态码和内容（可选）
22
    print(f"Status Code: {response.status_code}")
23
    print(f"Response: {response.text}")
24

25
if __name__ == "__main__":
26
    main()

撒花！
2. TTS
终于到了最重要的部分。用法如下：

1
http://127.0.0.1:9880/?refer_wav_path={refer_wav}&prompt_text={prompt_text}&prompt_language={prompt_language}&text={text}&text_language={text_language}&cut_punc={cut_punc}&top_k=15&top_p=1&temperature=1&speed=1&sample_steps=32&if_sr=false

其中：
refer_wav_path=主参考音频绝对路径
prompt_text=主参考音频文本
prompt_language=主参考音频语言（中文、英文等，详见webui中的选项）
text=要合成的文本
text_language=合成文本语言
cut_punc=切分方式（例如0.不切，详见webui中的选项）
其余参数在webui推理界面均有介绍，一般保持默认即可。
如果成功，返回一段wav音频。
示例代码：
tts_config.ini

1
[DEFAULT]
2
prompt_text = 请输入文本
3
refer_wav = D:/ABS/PATH/TO/FILE.wav
4
cut_punc = 0.不切
5
prompt_language = 中文

需要安装Requests和Pygame-ce（在较高Python版本，如3.14.0，可能无法安装Pygame，可以用Pygame-ce替代）

1
pip install requests
2
pip install pygame-ce

Python（tts.py）：

1
import configparser
2
import requests
3
import argparse
4
import pygame
5
import io
6
import os
7
import sys
8

9
def main():
10
    # 解析命令行参数
11
    parser = argparse.ArgumentParser(description='GSV-API-ADAPT')
12
    parser.add_argument('-text', required=True, help='要合成的文本')
13
    parser.add_argument('-language', required=True, help='文本的语言')
14
    args = parser.parse_args()
15

16
    text = args.text
17
    text_language = args.language
18

19
    # 获取配置文件路径
20
    config_path = "./tts_config.ini"
21

22
    # 读取配置文件
23
    config = configparser.ConfigParser()
24

25
    # 检查配置文件是否存在
26
    if os.path.exists(config_path):
27
        config.read(config_path, encoding='utf-8')
28
        print(f"成功读取配置文件: {config_path}")
29
    else:
30
        print(f"配置文件不存在: {config_path}，将使用默认值")
31

32
    # 获取配置项，如果不存在则提供默认值
33
    prompt_text = config.get('DEFAULT', 'prompt_text')
34
    refer_wav = config.get('DEFAULT', 'refer_wav')
35
    cut_punc = config.get('DEFAULT', 'cut_punc', fallback='0.不切')
36
    prompt_language = config.get('DEFAULT', 'prompt_language', fallback='中文')
37

38
    print(f"使用配置 - prompt_text: {prompt_text}")
39
    print(f"使用配置 - refer_wav: {refer_wav}")
40
    print(f"使用配置 - cut_punc: {cut_punc}")
41
    print(f"使用配置 - prompt_language: {prompt_language}")
42

43
    # 构造请求 URL
44
    url = (
45
        f"http://127.0.0.1:9880/?"
46
        f"refer_wav_path={refer_wav}&"
47
        f"prompt_text={prompt_text}&"
48
        f"prompt_language={prompt_language}&"
49
        f"text={text}&"
50
        f"text_language={text_language}&"
51
        f"cut_punc={cut_punc}&"
52
        f"top_k=15&"
53
        f"top_p=1&"
54
        f"temperature=1&"
55
        f"speed=1&"
56
        f"sample_steps=32&"
57
        f"if_sr=false"
58
    )
59

60
    try:
61
        # 发送 HTTP GET 请求
62
        response = requests.get(url)
63

64
        if response.status_code == 200:
65
            # 将返回的音频数据保存为临时文件
66
            audio_data = response.content
67

68
            # 初始化pygame mixer
69
            pygame.mixer.init()
70

71
            # 从字节流加载音频
72
            sound_buffer = io.BytesIO(audio_data)
73
            pygame.mixer.music.load(sound_buffer)
74

75
            # 播放音频
76
            pygame.mixer.music.play()
77

78
            # 等待播放完成
79
            while pygame.mixer.music.get_busy():
80
                pygame.time.wait(100)
81
        else:
82
            print(f"请求失败，状态码: {response.status_code}")
83
            print(f"响应内容: {response.text}")
84
    except requests.exceptions.RequestException as e:
85
        print(f"网络请求错误: {e}")
86
    except Exception as e:
87
        print(f"发生错误: {e}")
88

89
if __name__ == "__main__":
90
    main()

（代码使用QWEN-coder生成，人工修改）
用法：

1
python tts.py -text 要合成的文本 -language 语言

撒花！
那么最基础的API用法已经实现了，剩下的请各位发挥创意自行探索。

如果这篇文章对你有帮助，欢迎分享给更多人！

GPT-SoVITS API Basic Reference

https://iris-cat-blog.pages.dev/posts/gsvapi/

作者

Iris_cat

发布于

2026-04-18

许可协议

Unlicensed

部分信息可能已经过时

Hello, World!