或许我会考虑从轻处理文字转WAV音频