Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

接口增加workers参数,支持修改多进程数量,提高吞吐量和并发处理能力 #1724

Open
wants to merge 2 commits into
base: main
Choose a base branch
from

Conversation

v3ucn
Copy link
Contributor

@v3ucn v3ucn commented Oct 27, 2024

接口增加workers参数,支持修改多进程数量,提高吞吐量和并发处理能力

支持接口多进程
指定服务器版本,从而可以顺利修改进程数
@v3ucn
Copy link
Contributor Author

v3ucn commented Oct 27, 2024

#1722
#1183

@MysticMistM
Copy link

大佬,我在v2版本上试了下,有两点疑问:
1)改完之后显存占用大幅提升,原本1个worker占1.5G,改完之后差不多1个worker占2.5-3G显存,2个worker占用5G多显存,这是正常的吗?显存占这么多感觉没有提升效率还不如多开2个程序才占3G显存。
2)没有感觉到多线程推理,测试后还是串行的。完全是按您给的代码改了这两个文件,程序没有报错,运行后看日志配置和模型都加载了两份,但是没有多线程,是我哪里出错了吗?

@Chi8wah
Copy link

Chi8wah commented Nov 9, 2024

大佬,我在v2版本上试了下,有两点疑问: 1)改完之后显存占用大幅提升,原本1个worker占1.5G,改完之后差不多1个worker占2.5-3G显存,2个worker占用5G多显存,这是正常的吗?显存占这么多感觉没有提升效率还不如多开2个程序才占3G显存。 2)没有感觉到多线程推理,测试后还是串行的。完全是按您给的代码改了这两个文件,程序没有报错,运行后看日志配置和模型都加载了两份,但是没有多线程,是我哪里出错了吗?

根据 #1557 (comment)
这样只是做到了并发请求,实际到GPU推理的时候还是串行的。

@XXXXRT666
Copy link
Contributor

多worker效率只会更低,想并发建议多卡

@v3ucn
Copy link
Contributor Author

v3ucn commented Nov 10, 2024

大佬,我在v2版本上试了下,有两点疑问: 1)改完之后显存占用大幅提升,原本1个worker占1.5G,改完之后差不多1个worker占2.5-3G显存,2个worker占用5G多显存,这是正常的吗?显存占这么多感觉没有提升效率还不如多开2个程序才占3G显存。 2)没有感觉到多线程推理,测试后还是串行的。完全是按您给的代码改了这两个文件,程序没有报错,运行后看日志配置和模型都加载了两份,但是没有多线程,是我哪里出错了吗?

您好,pr里说的并发指的是fastapi的并发,并没有说是模型的并行推理,接口功能并不只是推理,还有动态切模型和动态切参考音频的功能,如果你只针对推理进行优化,可以用docker来分配gpu资源,没必要多卡

@MysticMistM
Copy link

大佬,我在v2版本上试了下,有两点疑问: 1)改完之后显存占用大幅提升,原本1个worker占1.5G,改完之后差不多1个worker占2.5-3G显存,2个worker占用5G多显存,这是正常的吗?显存占这么多感觉没有提升效率还不如多开2个程序才占3G显存。 2)没有感觉到多线程推理,测试后还是串行的。完全是按您给的代码改了这两个文件,程序没有报错,运行后看日志配置和模型都加载了两份,但是没有多线程,是我哪里出错了吗?

您好,pr里说的并发指的是fastapi的并发,并没有说是模型的并行推理,接口功能并不只是推理,还有动态切模型和动态切参考音频的功能,如果你只针对推理进行优化,可以用docker来分配gpu资源,没必要多卡

如果一张显卡,多开多个gptsovits是不是可以实现gpu并行推理呀,还需要用docker吗?

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

4 participants