这是我们四个的损失文字转WAV音频