他们只会去说文字转WAV音频