它不断地观察方源文字转WAV音频