他们都能够推测出来文字转WAV音频