然而现在我们在理论上文字转WAV音频