语音转文字时，最大支持多长时间 #3659

xxch · 2024-01-04T10:01:33Z

当语音时长为1分47秒时程序报错，并且直接当掉了。
Token indices sequence length is longer than the specified maximum sequence length for this model (515 > 513). Running this sequence through the model will
result in indexing errors已放弃(吐核)
问题1、
如何修改配置可以改变时长？
问题2、
程序报错的时候不应该直接当掉，如何捕获异常？

zxcd · 2024-01-16T11:22:02Z

语音过长的话是否考虑使用vad进行语音切分？目前大部分模型都有音频的时长限制，基本上太长了就会OOM。

xxch added Bug S2T asr/st labels Jan 4, 2024

xxch assigned zh794390558 Jan 4, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

语音转文字时，最大支持多长时间 #3659

语音转文字时，最大支持多长时间 #3659

xxch commented Jan 4, 2024

zxcd commented Jan 16, 2024

语音转文字时，最大支持多长时间 #3659

语音转文字时，最大支持多长时间 #3659

Comments

xxch commented Jan 4, 2024

zxcd commented Jan 16, 2024