也就是浅表性的泛泛而谈文字转WAV音频