恐怕就算让他们一个个去数文字转WAV音频