以前我们的误区是文字转WAV音频