我们不需要听细节文字转WAV音频