就是根据理论和经验分析推导出来的文字转WAV音频