它们为什么要分长短文字转WAV音频