你不但要分析全局文字转WAV音频