他们照顾到了很多细节文字转WAV音频