想象了一下李思辰描述的情况文字转WAV音频