他们也确实担心文字转WAV音频