问题的关键在于是不是公平文字转WAV音频