或是按照一个模式去衡量别人文字转WAV音频