就是他们要面对的文字转WAV音频