确实需要这种规模的通道文字转WAV音频