都是跟旁边的人提文字转WAV音频