然后催动灵识文字转WAV音频