但是他们仔细推算了一下文字转WAV音频