他们便在旁边做补充文字转WAV音频