他们之前都是旁观文字转WAV音频