那是因为我们没有足够的证据文字转WAV音频