先做整体把握文字转WAV音频