一部分是他们自用文字转WAV音频