因为不管哪方获得文字转WAV音频