有时候也是好几分钟没什么动静的文字转WAV音频