所以他们即使知道文字转WAV音频