我承认双方都是为了减少损失文字转WAV音频