-
Notifications
You must be signed in to change notification settings - Fork 8.4k
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
关于语音识别功能的使用 #415
Comments
同问,如何添加语音合成平台的api key |
一、接收语音,回复文字
二、接收语音,回复语音有多种可选平台,以下提供两种方案,默认是OpenAI识别,Google语音合成: 1.百度(1) 安装依赖: (2) 在 {
"speech_recognition": true,
"voice_reply_voice": true,
"baidu_app_id": "YOUR BAIDU APP ID",
"baidu_api_key": "YOUR BAIDU API KEY",
"baidu_secret_key": "YOUR BAIDU SERVICE KEY"
} 2.Google(1) 安装 SpeechRecognition: (2) 安装 ffmpeg 和 espeak
(3) 在 {
"speech_recognition": true,
"voice_reply_voice": true
} 注:在itchat中只能回复mp3文件;在wechaty中可以回复语音消息,wechaty中使用需要安装额外依赖: pip3 install pysilk-mod
pip3 install pydub 三、群组语音
PR: |
你好。为什么我填好了之后还是提示这个错误呢? |
修改了下,可以获取最新代码再试试 |
我同样的问题,获取最新的代码后在执行,提示: |
你需要安装:pip install baidu-aip |
安装下pip3 install baidu-aip chardet |
因为调用了baidu-aip库,终端输入pip3 install baidu-aip chardet 。 |
谢谢,已经解决了,程序默认的语音类型的百度,我没安装百度的这个库,刚刚改成谷歌了。谢谢~~ |
[INFO][2023-03-10 16:30:44][openai_voice.py:22] - [Openai] voiceToText text=回复一个语言 voice file name=tmp/230310-163043.mp3 使用的是谷歌的语音类型,但是微信没有回复任何消息 |
在itchat中只能回复mp3文件,在wechaty中可以回复语音消息 itchat和wechaty,是在哪个配置项,还是哪个文件上指定了 |
wechaty比itchat更容易被封吗? |
wechaty 语音功能还不支持 |
Start auto replying. 这个语音错误是杂回事啊 |
[INFO][2023-03-13 00:36:38][openai_voice.py:22] - [Openai] voiceToText text=A, B, C. voice file name=tmp/230313-003636.mp3 |
在百度云账号领一下免费额度应该就行 |
wechaty方案的语音识别是不是没对接?代码中找不到这部分 |
一样找不到,求更新!!! |
按要求配置了"speech_recognition": true,但是实测不生效,后台日志没有显示任何反应。 |
这个是因为没有修改配置,代码默认使用百度,如果要使用谷歌需要在bridge/bridge.py中修改为谷歌 |
"baidu_app_id", "baidu_api_key", "baidu_secret_key" 这三个配置了嘛 |
@chiakileftcang @1018987534 对的,wechaty暂时还没对接发送语音 |
我已经给你接好了,给个代码提交权限呗 |
@chiakileftcang 那太好了, 你直接发起 pull request 就好 |
在bridge的位置如何修改为google ? |
fetch_text_to_voice函数中的“baidu“换成"google" |
wechaty 回复语音已实现:#476 |
奇怪,我在另一台机器上,安装了ffmpeg后还是出现这个错误,还有没有别的原因了? |
我都设置为调用百度的API 为什么还需要 安装ffmpeg这个呢 |
请教这个是什么问题啊? |
是#948 这种情况吗 |
应该是这个情况。我吧公众号认证一下试试 |
怎么重新生成二维码 |
我在google 的cloud run上部署了这个项目来对接企业微信的自建应用,文本已经可以正常接发了。但是我设置"speech_recognition": true, 然后发送语音,按说明,应该是会调用默认的openai来识别语音并回复文字,但收到的回复是: 请问要如何解决呢?十分感谢 |
企业应用号需要ffmpeg,并安装amr编码器 |
语音合成失败 我打印下被合成的文本 发现没有问题。就是让百度去合成的时候报错,错误代码513。百度技术文档没有这个错误代码
|
按您说的装上后就可用了 |
112.53.2.93:35534 - - [09/May/2023 06:21:57] "HTTP/1.1 POST /wxcomapp" - 200 OK |
[WARNING][2023-05-10 17:05:34][chat_channel.py:174] - [WX]any to wav error, use raw path. name 'any_to_wav' is not defined |
[WARNING][2023-05-17 19:40:55][chat_channel.py:175] - [WX]any to wav error, use raw path. name 'any_to_wav' is not defined |
老兄,这个问题怎么解决的呀,我也遇到了 |
@jones-so 企业应用号需要ffmpeg,并安装amr编码器,前面有个大神已经回复了。实测可行 |
您的邮件创视已经收到,请等待我给您的回复,祝您开心!
|
google 不走代理吗,超时了 |
您的邮件创视已经收到,请等待我给您的回复,祝您开心!
|
我的代码没看到什么’百度‘,而是这样的 |
请问你用的是啥通道能看到Google的语音回复?好像我的wechatmp这个通道不能使用语音识别?多次显示http状态吗200之后就直接错误了[ERROR] |
为什么我在微信中使用回复的还是mp3文件呀 |
您的邮件创视已经收到,请等待我给您的回复,祝您开心!
|
请问你这个解决了吗,我也是遇到这样的问题返回的不是微信语音而是mp3文件 |
|
您的邮件创视已经收到,请等待我给您的回复,祝您开心!
|
依赖都安装了,收到语音还是提示错误,请问如何解决呀?应该是默认用的tts-1和whisper-1模型吧?我也没其他设置
|
您的邮件创视已经收到,请等待我给您的回复,祝您开心!
|
前置确认
问题描述
"voice_reply_voice": true这个语句没在config-template.json里找到,不过应该是添加到chatgpt-on-wechat/config.json里面吧?...
对应语音合成平台的key是阿里云的
终端日志 (如有报错)
环境
python3 -V
):python 3.9pip3 -V
):pip 23.0.1The text was updated successfully, but these errors were encountered: