综合了这么多的数值文字转WAV音频