多半就是他们所说的文字转WAV音频