那就是每次看到对方的训练动作文字转WAV音频