他们不需要出声文字转WAV音频