也就是我们不懂的文字转WAV音频