因为越到后面越容易被针对文字转WAV音频