它们大部分是次品文字转WAV音频