也就需要相当大的投资文字转WAV音频