或许是因为当初的眼力限制文字转WAV音频