至少三次的机会文字转WAV音频