最多就是宿主文字转WAV音频