这次是两个修士同时开口文字转WAV音频