通过它们的描述文字转WAV音频