省去了很多口舌文字转WAV音频