所以他们下意识的就觉得文字转WAV音频