当中的过程非常辛苦文字转WAV音频