但很多具体的细节并没有文字转WAV音频