他甚至能够预计到文字转WAV音频