就必须要云家出声才成文字转WAV音频