或者说变通式的坚持文字转WAV音频