我们确实难以接受文字转WAV音频