就是把这个片段嵌入原力阵列的人文字转WAV音频