倒不如说是自大文字转WAV音频