从人数上就很容易暴露文字转WAV音频