所以他才能跨越比较大的分数差文字转WAV音频