他认为只要能够拖上一段时间文字转WAV音频