从而得出他的大致分数文字转WAV音频