第二段则更为严重文字转WAV音频