他们完全能够预想文字转WAV音频