那就必然需要抽取大量的流动资金文字转WAV音频