第二层便是加深加强文字转WAV音频