有一半的情况是前辈和后进之间展开的文字转WAV音频