他们显然是在行的文字转WAV音频