你能不能不要每一次说话文字转WAV音频