原因就在于台词的生命力文字转WAV音频