因为考虑到这里是教室文字转WAV音频