有两个修士一组的文字转WAV音频