所以守说话间还是偏向了谢家文字转WAV音频