而其他人都是三五成群文字转WAV音频