通过前面稍微低洼的区域文字转WAV音频