但是最起码应该有一个目标和方向文字转WAV音频