那么就会刻意的去引导文字转WAV音频