再加上自身的推算文字转WAV音频