前者占据绝大多数文字转WAV音频