所以他自然地了解到文字转WAV音频