等待着随时可能出现的目标文字转WAV音频