因为现场就有好些不会化妆的文字转WAV音频