这便可以解释他们当初的疑问了文字转WAV音频