不过问题是这样一来整个配套体系都需要升级文字转WAV音频