还要兼顾数量文字转WAV音频